に別のRDDに基づくRDDをフィルターI持っているこのRDDの私はフィルタリングすると、それは次のように見えること:スパーク
End of field Start of field Connection duration
:私はこのようなことを最初の6行をフィルタリングしたい
text (06.07.03.216) COPYRIGHT © skdjh 2000-2015
File 160614_54554.vf Database 53643_csc Interface 574 zn 65
Start Date 14/06/2016 00:00:00:000
End Date 14/06/2016 00:14:59:999
State "S587654"
End of field Start of field Connection duration
これを達成するための最も効率的な方法は何ですか?私は考えました。 オプション1:この行 これを行うための最善の方法は何をフィルタリングすることができる関数を作成:新しいRDDは、この行が含まれ、それらは は、オプション2の参加を持つフィルタを作成? ありがとう!
あなたはより具体的な例を提供することができます...私は彼ら(最初の6行)を必要といけないラインを持っているファイルを持っている...あなたがここに欲しいもの –