pandas.merge
を使用して2つのデータフレームをマージしています。 how = left
オプションを指定した後でも、マージされたデータフレームの行数が元のものよりも大きいことがわかりました。なぜこれが起こるのですか?`pandas.merge`と` left`オプションを指定しても行数が変化します
panel = pd.read_csv(file1, encoding ='cp932')
before_len = len(panel)
prof_2000 = pd.read_csv(file2, encoding ='cp932').drop_duplicates()
temp_2000 = pd.merge(panel, prof_2000, left_on='Candidate_u', right_on="name2", how="left")
after_len = len(temp_2000)
print(before_len, after_len)
> 12661 13915
あなたの答えは完璧です!ありがとう!私の場合、 '.drop_duplicates(subset =" name2 ")'は重複した行を削除し、それは私の目的のためにうまくいきました! – user51966
運が良かったのはうれしかった! – Thanos