をチェック日付に基づいて新しい列を作成します。私はScalaでは2つのデータフレーム持っ
df1 =
ID Field1
1 AAA
2 BBB
4 CCC
と
df2 =
PK start_date_time
1 2016-10-11 11:55:23
2 2016-10-12 12:25:00
3 2016-10-12 16:20:00
を私はまた、フォーマット2016-10-11
に等しいyyyy-MM-dd
で変数start_date
を持っています。
df1
に新しい列check
を作成する必要があります。If PK is equal to ID AND the year, month and day of start_date_time are equal to start_date, then check is equal to 1, otherwise 0
です。
結果はこのようになります。
my previous questionでdf1 =
ID Field1 check
1 AAA 1
2 BBB 0
4 CCC 0
私は2つのデータフレームを持っていたし、それが参加し、フィルタリングを使用することが示唆されました。ただし、この場合は動作しません。私の最初のアイデアはudf
ですが、このケースではどのように動作させるかはわかりません。
sparkを使用していることを指定します。私が知っているScalaには、デフォルトのデータフレームはありません。 – Chobeat