Spark用のScalaでの2つのHashMap（HashMap <Integer、HashSet <Integer>>）のRDD

私はスタンドアロンマシン（Windows 10を持つPC）でSparkでプログラミングするためにScalaで作業しています。私は初心者であり、スカラとスパークのプログラミング経験はありません。だから私は助けに非常に感謝します。Spark用のScalaでの2つのHashMap（HashMap <Integer、HashSet <Integer>>）のRDD

問題：

私は、その値が整数のエントリのHashSetsあるHashMapの、hMap1を、持っている（HashMapの>）。私はその値（すなわち、多くのHashSet値）をRDDに保存します。コードは

val rdd1 = sc.parallelize(Seq(hMap1.values()))

以下のように今は、同じタイプの別のHashMap、hMap2、すなわち、ハッシュマップ>を持っています。

入力：

その値はまた、私は、私は例えばhMap1とhMap2

の値を交差することができる方法を知りたい

val rdd2 = sc.parallelize(Seq(hMap2.values()))

としてRDDに格納されています

のデータrdd1 = [2, 3], [1, 109], [88, 17]

と0のデータ

出力

ので、出力= [2, 3], [1, 109]

出典

2017-11-12 Kifayat

Spark用のScalaでの2つのHashMap（HashMap <Integer、HashSet <Integer>>）のRDD

答えて

関連する問題