for i in range(1, len(df)):
if df.loc[i]["identification"] == df.loc[i-1]["identification"] and df.loc[i]["date"] == df.loc[i-1]["date"]:
df.loc[i,"duplicate"] = 1
else:
df.loc[i,"duplicate"] = 0
この単純なforループは、大きなサイズのデータフレームを処理するときに非常に遅くなります。Pandasデータフレームを使用する場合、slow for():ループを避けるにはどうすればよいですか?
提案がありますか?
「スロー」と「ビッグサイズ」の詳細をご記入ください。 – Danra