2017-11-12 13 views
0

私はスタンドアロンマシン(Windows 10を持つPC)でSparkでプログラミングするためにScalaで作業しています。私は初心者であり、スカラとスパークのプログラミング経験はありません。だから私は助けに非常に感謝します。Spark用のScalaでの2つのHashMap(HashMap <Integer、HashSet <Integer>>)のRDD

問題:

私は、その値が整数のエントリのHashSetsあるHashMapの、hMap1を、持っている(HashMapの>)。私はその値(すなわち、多くのHashSet値)をRDDに保存します。コードは

val rdd1 = sc.parallelize(Seq(hMap1.values())) 

以下のように今は、同じタイプの別のHashMap、hMap2、すなわち、ハッシュマップ>を持っています。

入力:

その値はまた、私は、私は例えばhMap1とhMap2

の値を交差することができる方法を知りたい

val rdd2 = sc.parallelize(Seq(hMap2.values())) 

としてRDDに格納されています

のデータrdd1 = [2, 3], [1, 109], [88, 17]

と0のデータ

出力

ので、出力= [2, 3], [1, 109]

答えて

関連する問題