日付セット間にギャップがあるかどうかを判断する必要があります(開始日と終了日によって決定されます)。データフレームa
についてパンダを使用して日付に隙間があるかどうかを確認
import pandas as pd
a = pd.DataFrame({'start_date' : ['01-01-2014', '01-01-2015', '05-01-2016'],
'end_date' : ['01-01-2015', '01-01-2016', '05-01-2017']})
order = ['start_date', 'end_date']
a = a[order]
a.start_date = pd.to_datetime(a.start_date, dayfirst= True)
a.end_date = pd.to_datetime(a.end_date, dayfirst= True)
b = pd.DataFrame({'start_date' : ['01-01-2014', '01-01-2015', '05-01-2016',
'05-01-2017', '01-01-2015'],
'end_date' : ['01-01-2015', '01-01-2016', '05-01-2017',
'05-01-2018', '05-01-2018']})
order = ['start_date', 'end_date']
b = b[order]
b.start_date = pd.to_datetime(b.start_date, dayfirst= True)
b.end_date = pd.to_datetime(b.end_date, dayfirst= True)
a
b
、解決策が十分に単純です:私は2つの例のデータフレームを持っています。 start_date
で注文すると、end_date
が1つ下にずれて日付が差し引かれます。差が正であれば、日付に差があります。
しかし、これをデータフレームb
に適用すると、より広い範囲を含む範囲があるため、あまり明確ではありません。私は間違ってギャップを見つけることはありませんこれを行う一般的な方法で不明です。これは、グループ化されたデータ(約40000グループ)に対して行われます。
私はあなたがこれを削除したと思いました。まあ問題ありません:-) – piRSquared
@ piRSquared、率直に言って私は覚えていません... ;-) – MaxU