私は、左アウトジョインを使用して2つのデータフレームから重複エレメントを削除するソリューションを実装しています。結合条件を実行した後、私は右の表のNULL列をチェックする必要があります。整数型カラムのNULLチェックを結合した後のスパークデータフレーム
val llist = Seq(("bob", "2015-01-13", 4), ("alice", "2015-04-23",10))
val left = llist.toDF("name","date","duration")
val right = Seq(("alice", "2015-04-23",10),("bob", "2015-04-23", 23)).toDF("name","date","duration")
val df = left.join(right , left("name") === right("name") &&
left("date") === right("date") &&
left("duration").cast(StringType) === right("duration").cast(StringType)
,"left_outer").filter(right("duration").isNull)
しかし、null値の整数列をフィルタリングできません。結合後に整数のヌルチェックを行うにはどうすればよいですか?
なぜ、 'duration'(これはInt)をStringにキャストしますか? –
質問に入力データフレームと予想される出力データフレームを追加できますか? – mrsrinivas