"01"〜 "15"という名前のいくつかの異なるフォルダと、 "00-00.txt"という名前の各フォルダインクルードファイルからなるデータセットがあります。 "23-59.txt"(各フォルダは1日を示す)。テキストファイルの最初の行の一部をRDDのキーとして使用
ファイルには以下のような行があります。 (!AIVDM
始まる各エントリは最初のものを除いて、ラインである、それは数字で始まる)
1443650400.010568 !AIVDM,1,1,,B,[email protected]>h8Jr6?vN2><,0*4B
!AIVDM,1,1,,A,4022051uvOFD>RG7kDCm1iW0088i,0*23
!AIVDM,1,1,,A,[email protected]@PHRwPM<[email protected]`OvN2><,0*4C
!AIVDM,1,1,,A,13n1mSgP00Pgq3TQpibh0?vL2><,0*74
!AIVDM,1,1,,B,177nPmw002:<Tn<gk1toGL60><,0*2B
!AIVDM,1,1,,B,139eu9gP00PugK:N2BOP0?vL2><,0*77
!AIVDM,1,1,,A,13bg8N0P000E2<BN15IKUOvN2><,0*34
!AIVDM,1,1,,B,14bL20003ReKodINRret28P0><,0*16
!AIVDM,1,1,,B,15SkVl001EPhf?VQ5SUTaCnH0><,0*00
!AIVDM,1,1,,A,14eG;ihP00G=4CvL=7qJmOvN0><,0*25
!AIVDM,1,1,,A,[email protected]<cKrL=6nJ9QfN2><,0*30
Iは、キーと値のペアのRDD、キーや線である長い値1443650400.010568
が欲しいです!AIVDM...
から値が始まります。どうすればこれを達成できますか?
!AIVDMで始まる残りのレコードはどうしますか? –
私はその番号がすべてのalの鍵になりたいので、rddは次のようなものになります:(1443650400.010568、!AIVDM、1,1、B、15NOHL0P00J @ uq6> h8Jr6?vN2><、0 * 4B) ( '1443650400.010568、 !AIVDM、1,1、A、4022051uvOFD> RG7kDCm1iW0088i、0 * 23) –