私は2つのデータフレームdf1とdf2を持っています。 DF1は、String型df1.keyがdf2.keys中に存在しているとき、私は2つのデータフレームに参加したい配列を含むJavaスパークデータフレーム結合列
df1.show() key ---- k1 k2 k3 df2 has 2 columns df2.show() topic | keys ------------- t1 | [k1, k2] t2 | [pk1, pk2]
の1列のキーを持っています。前の例がここに掲載されていたのを見たSpark: Join dataframe column with an array
しかし、私は完全な単語の一致を探しています。メソッドを含むメソッドは、部分的に一致する行を結合しています。上記の例では、配列にキーk2が含まれていないため、[pk1、pk2]とk2を結合したくないということです.pk2が含まれています。
誰かがこの場合に参加する方法を提案できますか? JAVAで例を挙げてください。あなたは何ができるか
パーフェクト!これはJavaの私のためにも働く!ありがとう!! – kamnemm