2016-04-22 7 views
1

私はこのように見える2つのCSVファイルを持っている...PythonのCSVkit比較CSVファイル

CSV 1

reference | name | house 
---------------------------- 
2348A  | john | 37 
5648R  | bill | 3 
RT48  | kate | 88 
76A  | harry | 433 

CSV2

reference 
--------- 
2348A 
76A 

のPythonを使用してCSVkit私はそれをCSV2と比較してCSV1の行の出力CSVを作成しようとしています。誰かが私の方向に私を指すことができる例がありますか?

答えて

1

私はあなたが探しているものを達成するためにpandasを使用することをお勧めします:

そして、ここではそれがパンダを使用される方法は簡単です、あなたの2つのCSVファイルは、このようなものです考えてみます。

CSV1

reference,name,house 
2348A,john,37 
5648R,bill,3 
RT48,kate,88 
76A,harry ,433 

CSV2

reference 
2348A 
76A 

コード

import pandas as pd 
df1 = pd.read_csv(r'd:\temp\data1.csv') 
df2 = pd.read_csv(r'd:\temp\data2.csv') 
df3 = pd.merge(df1,df2, on= 'reference', how='inner') 
df3.to_csv('outpt.csv') 

output.csv

,reference,name,house 
0,2348A,john,37 
1,76A,harry ,433