私は複数の列の結合を行っている2つのデータフレームを持っています。最初の列のペアは等価比較を行い、2番目のペアは等しくない比較です。コードは次のようになりますApache Spark Dataframe - 非等価結合の設定に関する問題
val arule_1w = itemLHS
.join(itemRHS, itemLHS("CUST_ID") === itemRHS("CUST_ID") && itemLHS("LHS") != itemRHS("RHS")
得られたデータは、まだそれが、等しくないと参加するべきではないitemLHS(「LHS」)= itemRHS(「RHS」)を含有する行を有します。多分ユーザーエラーかもしれませんが、私の研究ではフォーマットが正しいと私に伝えています。すべてのデータ型は文字列値です。
ありがとうございました!
私はそれを試してみたのだが、次のエラーがスローされます:「解決することはできません((CUST_ID = CUST_ID)&& LHS) '((CUST_ID = CUST_ID)&& LHS)'(ブール値と文字列)のデータ型が異なるために発生します。それは何かを理解していないようなものです!==はです。 –
これは優先順位の問題です。 '=!='を試してみてください。 –