を有する二つのCSVファイル間の珍しい行を見つけます最初に2番目のデータフレームに存在しないコード。この場合、CCC。私は、次のデータ</p> <pre><code>code AAA BBA CCC </code></pre> <p>と異なる構造が、共通の列を持つ別のcsvファイルで1つのCSVファイルを持っている一般的なフィールド
どうすればいいですか?
を有する二つのCSVファイル間の珍しい行を見つけます最初に2番目のデータフレームに存在しないコード。この場合、CCC。私は、次のデータ</p> <pre><code>code AAA BBA CCC </code></pre> <p>と異なる構造が、共通の列を持つ別のcsvファイルで1つのCSVファイルを持っている一般的なフィールド
どうすればいいですか?
pandas
タグを使用しているので、pandas
という解決策の後であると見なします。あなたは二つの異なるデータフレームの両方でCSVファイルを読んでいた場合は、最初のCSVがdf_1
で読むとdf_2
に2番目のしていることを仮定して、あなたはこれを行うことができます:
>> df_1[~df_1['code'].isin(df_2['code'])][['code']]
または
>> set(df_1['code'].values.tolist()) - set(df_2['code'].values.tolist())
か
>> set(list(df_1['code'])) - set(list(df_2['code']))
私はこれが助けてくれることを願っています!
http://stackoverflow.com/questions/6486450/python-compute-list-difference –