私は開始日の列と終了日の列を持つデータフレームを持っています。開始日が終了日より前であることを確認して、日付の完全性をチェックします(start_date < end_date).14,000回以上の観測があります。私はちょうどので、私はそれらを削除することができ、誤ったものがあるかどうかをハイライトしたいにもかかわらず、に結果を書き込むために列を追加したPythonで2つの列の日付を効率的に比較する
Start End
0 2008-10-01 2008-10-31
1 2006-07-01 2006-12-31
2 2000-05-01 2002-12-31
3 1971-08-01 1973-12-31
4 1969-01-01 1969-12-31
:
は私がの形式でデータを持っている
dates['Correct'] = " "
し、次を使用して、各日付のペアをチェックし始めている、私のデータフレームが呼び出された日付:
for index, row in dates.iterrows():
if dates.Start[index] < dates.End[index]:
dates.Correct[index] = "correct"
elif dates.Start[index] == dates.End[index]:
dates.Correct[index] = "same"
elif dates.Start[index] > dates.End[index]:
dates.Correct[index] = "incorrect"
これは、本当に本当に長い時間(約15分)を取っているだけです。より効率的に実行するコードが必要です - 私が間違っていることや改善できることがありますか?
最後の 'elif'を削除し、' else'で置き換えてください。 – Deepanshu