2015-10-22 21 views
9

私はスパークRDDに変換したいタプル(String、String、Int、Double)のリストを持っています。Scala Iterable [tuple]をRDDに変換

一般に、Scala Iterable [(a1、a2、a3、...、an)]をSpark RDDに変換するにはどうすればよいですか?

答えて

8

そこには、これを行うにはいくつかの方法がありますが、ほとんどの海峡進むべき道はただスパークコンテキストを使用することです:

import org.apache.spark._ 
import org.apache.spark.rdd._ 
import org.apache.spark.SparkContext._ 

sc.parallelize(YourIterable.toList) 

私はsc.Parallelizeリストに変換が必要だと思いますが、それはあなたの構造を保持しますしたがって、あなたはまだRDDを取得します。[String、String、Int、Double]

+1

sc.parallelize(MyIterable.toSeq)も働いています – menorah84

関連する問題