2016-07-07 20 views
0

2つの配列Array1(1,2,3)とArray2(4,5,6)があるとします。 私はそれらを新しいArray3((1,4)、(2,5)、(3,6))に結合したい 私がスパークでそれを試している間、それはなります。Sparkで2つの配列を並列コレクションで結合するにはどうすればよいですか?

コード

val data1 = Array(1, 2, 3, 4, 5) 
val data2 = Array(2, 3, 4, 5, 6) 
val distData1 = sc.parallelize(data1) 
val distData2 = sc.parallelize(data2) 

val distData3 = distData1 ++ distData2 
distData3.foreach(println) 

出力

1 
2 
3 
4 
5 
6 

どのように私はそれらを正しく組み合わせることができますか?

//更新*

私のプログラムでは(例とは異なります)。 label.zip(機能)にしたい。私の特徴は機能です:Array [String]と私のラベルはArray [String]です。なぜそれは動作しませんか?

<console>:98: error: type mismatch; 
found : org.apache.spark.rdd.RDD[Array[String]] 
required: scala.collection.GenIterable[?] 
+0

正確なコードを投稿したいですか?このコードは正しくありません。 distData3.foreach(println)を実行して出力を取得することはできません。 – eliasah

答えて

0

data1.zip(data2)でも可能ですが、配布が異なる場合は動作しません。

関連する問題