1

データファイルを次のように分割しようとしています。最初の行の要素を共通に維持するスカラの分割線

1 1#1097#2321#2018 
2 12#312#123#1211 

だから私は結果RDDになりたい:私はカウントしないであろうに、あなたはすでにRDDとしてあなたのラインを持っていると仮定すると(および入力には可能性のあるエラーがない

1 1 
1 1097 
1 2321 
1 2018 
2 12 
2 312 
2 123 

答えて

1

、あなたは、いくつかの事前検証/フィルタリングを追加することができます):

lines.flatMap { case line => 
    val Array(head, other) = line.split(" ") 
    other.split('#').map(o => head -> o) 
} 
+0

そして、私は私の行を分割したい場合は#* #する@ N #t2の #cN #のindex6 666 #%15 #%487 #%925 位!abcdefff(出力は(、(6666,15)、(6666,487)でなければなりません6666,925))rp2105 @ –

+0

、あなたはコードをフォーマットすることができますか?私はそれが今述べられているように質問を得ない。 – tkroman

+0

先生、正しい形式については、下記の回答をご確認ください。ありがとう。 –

関連する問題