0
2つの配列Array1(1,2,3)とArray2(4,5,6)があるとします。 私はそれらを新しいArray3((1,4)、(2,5)、(3,6))に結合したい 私がスパークでそれを試している間、それはなります。Sparkで2つの配列を並列コレクションで結合するにはどうすればよいですか?
コード
val data1 = Array(1, 2, 3, 4, 5)
val data2 = Array(2, 3, 4, 5, 6)
val distData1 = sc.parallelize(data1)
val distData2 = sc.parallelize(data2)
val distData3 = distData1 ++ distData2
distData3.foreach(println)
出力
1
2
3
4
5
6
どのように私はそれらを正しく組み合わせることができますか?
//更新*
私のプログラムでは(例とは異なります)。 label.zip(機能)にしたい。私の特徴は機能です:Array [String]と私のラベルはArray [String]です。なぜそれは動作しませんか?
<console>:98: error: type mismatch;
found : org.apache.spark.rdd.RDD[Array[String]]
required: scala.collection.GenIterable[?]
正確なコードを投稿したいですか?このコードは正しくありません。 distData3.foreach(println)を実行して出力を取得することはできません。 – eliasah