I持つ二つのスパークデータフレームのを、df1
とdf2
:スパークSQLデータフレームAPI -buildフィルタ条件を動的
df1
から
非一致レコードを取得する必要があります +-------+-----+---+
| name|empNo|age|
+-------+-----+---+
|shankar|12121| 28|
| ramesh| 1212| 29|
| suresh| 1111| 30|
| aarush| 0707| 15|
+-------+-----+---+
+------+-----+---+-----+
| eName| eNo|age| city|
+------+-----+---+-----+
|aarush|12121| 15|malmo|
|ramesh| 1212| 29|malmo|
+------+-----+---+-----+
別のファイルで指定されています。たとえば、列のルックアップファイルは、以下のようなものです
:
df1col,df2col
name,eName
empNo, eNo
期待出力は次のとおりです。
+-------+-----+---+
| name|empNo|age|
+-------+-----+---+
|shankar|12121| 28|
| suresh| 1111| 30|
| aarush| 0707| 15|
+-------+-----+---+
考え方は上記のために動的にWHERE条件を構築する方法でありますシナリオは、ルックアップファイルが設定可能であるため、1〜n個のフィールドを持つ可能性があります。
をなぜ期待される出力のaarushはありますか?雇用者番号は2つのデータフレームで異なります。 – Shaido
@Shaido:訂正してくれてありがとう、私は質問を更新しました。私はdf1から不一致のレコードを取得する必要があります。 – Shankar
@ツァハゾハール:あなたはこれにいくつかの光を投げることができますか? – Shankar