2016-08-16 7 views
0

私は以下のようにスパークRDDを持っています。Apache spark変換 - ラインを分割してコンビネーションを作成

abc,def,ghi 

sdfdf,sdfsdf,dfdf444sdsdd 

私は2つのスピッティングすべての値の異なる組み合わせを作成するにはカンマ(、)でそれを分割することにより、すべてのレコード(行)を変換したいです。

出力RDD(例えば)はflatMapは組み合わせの部分に使用されている必要があり

abc def 

abc ghi 

def ghi 
+0

私は以下を試みたが、それは働いていない、次のようなものを使用してください。 –

+0

ヴァルY = testA.map(X => { VAR ABD = x.split( "") (abd.length> IF(N <1) { - 0 abd.length(TO - 1)) {ため (G < - N + 1までabd.length) {(ABD(0)+ ABD(0))} }他 } { " " } } ) –

答えて

1

を下回っています。

rdd.map(_.split(",")).flatMap(tokens => getCombinations(tokens)) 

... getCombinationsは、シグネチャがあります:

def getCombinations(tokens: List[String]): List[(String, String)] 
関連する問題