0
Java Sparkを使用して2つのJavaPairRDDをキーに基づいて比較し、その値を比較して同じキーがまったく同じ値であるかどうかを確認します。2つのJavaPairRDDをキーで比較し、値を比較する方法は?
は今のところ、私は交差点や労働組合の数を()をチェックしていますが、これは以下のように、十分ではありません。彼らは同じキーを持っている場合
JavaPairRDD<String, String> intersectionJavaPairRDD = hBaseJavaPairRDD.intersection(hiveJavaPairRDD);
JavaPairRDD<String, String> unionJavaPairRDD = hBaseJavaPairRDD.union(hiveJavaPairRDD).distinct();
if (intersectionJavaPairRDD.count() != unionJavaPairRDD.count()
|| hiveJavaPairRDD.count() != hBaseJavaPairRDD.count()) {
System.err.println(
"ERROR: SxS validation failed...");
System.exit(-1);
}
がどのようにそれぞれの値を比較することができますか?
ありがとうございます!
combineByKey/AggregateByKeyを使用して値を比較できます。 – Knight71