1
私は以下の問題を抱えています:都市値が 'noClue'のとき、データフレームAに列RealCity
を追加したい、キーを使用してdf Bから選択するもの、市を得る。spark別のdfにcondtionsを持つデータフレームに列を追加する
表A:
+---------+--------+
| Key | City|
+---------+--------+
|a | PDX |
+---------+--------+
|b | noClue |
表B:
+---------+--------+
| Key | Name |
+---------+--------+
|c | SYD |
+---------+--------+
|b | AKL |
私は.withColumn
とwhen
を使用したいが、私はそれをこの方法を実行して、値が別のテーブル(テーブルB)を選択することはできません。これを行う良い方法は何ですか?どうもありがとう!
あなたの表Bは、どのように大きなあるとして、最終的な出力を持っている必要があります –