2
join
は、一致するキーを持つ要素のすべてのペアを含むRDDを返します。.join()pysparkの逆
https://spark.apache.org/docs/1.6.2/api/python/pyspark.html#pyspark.RDD.join
例:
trueDupsRDD = (rdd1.join(rdd2))
がどのように分けるを行うことができますか?
私が試した:
notMatchingRDD = (rdd1.join(!rdd2))
何? –