私は、次のデータフレームがあります。Python:2リストを含む列。それらの2つのリスト間の共通の値を削除する新しい列を取得する方法は?
carrier flightnumber departureAirport arrivalAirport effectiveDate date group_dates
0 4U 9748 DUS GVA 2017-05-09 [2017-05-09, 2017-05-10, 2017-05-11, 2017-05-1... [2017-05-09, 2017-05-10, 2017-05-11, 2017-05-1...
1 4U 9748 DUS GVA 2017-05-14 [2017-05-14, 2017-05-15, 2017-05-16, 2017-05-1... [2017-05-09, 2017-05-10, 2017-05-11, 2017-05-1...
2 4U 9748 DUS GVA 2017-07-08 [2017-07-08, 2017-07-09, 2017-07-10, 2017-07-1... [2017-05-09, 2017-05-10, 2017-05-11, 2017-05-1...
3 AG 1234 SFO DFW 2017-03-09 [2017-03-09, 2017-03-10, 2017-03-11, 2017-03-1... [2017-03-09, 2017-03-10, 2017-03-11, 2017-03-1...
4 AG 1234 SFO DFW 2017-03-14 [2017-03-14, 2017-03-15, 2017-03-16, 2017-03-1... [2017-03-09, 2017-03-10, 2017-03-11, 2017-03-1...
を、私は基本的に列group_dates
と同じである新しい列を作成したいが、ここでは列にdate
を記載されている任意の要素を削除すると、私がやったものです:
私は、カスタム関数を作成し、apply
def get_unique_dates(row):
return [x for x in row['group_dates'] if x not in row['date']]
df['unique_dates'] = df.apply(get_unique_dates, axis=1)
にそれを渡します
しかし、これは次のエラーを返して:ここでは
ValueError: Empty data passed with indices specified.
を使用することができますか? – frankyjuang
バージョン0.20.1を使用しています –