0
私はスタンドアロンマシン(Windows 10を持つPC)でSparkでプログラミングするためにScalaで作業しています。私は初心者であり、スカラとスパークのプログラミング経験はありません。だから私は助けに非常に感謝します。Spark用のScalaでの2つのHashMap(HashMap <Integer、HashSet <Integer>>)のRDD
問題:
私は、その値が整数のエントリのHashSetsあるHashMapの、hMap1を、持っている(HashMapの>)。私はその値(すなわち、多くのHashSet値)をRDDに保存します。コードは
val rdd1 = sc.parallelize(Seq(hMap1.values()))
以下のように今は、同じタイプの別のHashMap、hMap2、すなわち、ハッシュマップ>を持っています。
入力:
その値はまた、私は、私は例えばhMap1とhMap2の値を交差することができる方法を知りたい
val rdd2 = sc.parallelize(Seq(hMap2.values()))
としてRDDに格納されています
のデータrdd1 = [2, 3], [1, 109], [88, 17]
と0のデータ
出力
ので、出力= [2, 3], [1, 109]