2017-12-26 11 views
0

私は2つの異なるJavaPairRddをKey1、value、もう1つはkey2、valueを持っています。達成しようとしているのはそれらをマージすることですが、同じ値を持つアイテムだけを取得します。JavaPairRDDの相違点

は、私は、次の試してみました:国、値とfilteredsmallRddが含まれています:キー:ID、値をfilteredRddキーが含まれてい

JavaPairRDD<String, String> finalRdd = filteredRdd.intersection(filteredsmallRdd); 

。どの要素が同じ値を持っている必要があります。交差点では、唯一のキーを比較して空の解を得て、それをどうするか考えていますか?

答えて

0

swapを使用して、各rddのキーとして値を変更して交差を実行できます。

JavaPairRDD<String,String> finalRdd = filteredRdd.mapToPair(f -> f.swap()).intersection(filteredsmallRdd.mapToPair(f -> f.swap()));