Python：2つのCSVリストを比較する

私は2つのcsvファイルを比較し、それらを検索して特定の値を見つけようとしています。以下の例。Python：2つのCSVリストを比較する

FILE ONE

のFirstName、LastNameの、年齢

ジョン、ドウ、45

ジェーン、ドウ、34

ロバート、スマイト、27

ボブ、White、56

ケーリー、ウッズ、28

FILE TWO

姓

ロバート

ジェーン

スクリプトファイルの1のを検索し、ファイル二つのFirstNameの列を使用する必要がありますFirstName列と年齢を返しますマイコードのみロバートを出力34

結果ロバート、27 ジェーン、27それはジェーンの二行を探し続けていません。私は成功していないWhileループを使ってみました。どんな援助も大歓迎です！ありがとう！

今年は、10k行以上のファイルで50個以上のアイテムを検索しています。以下は

コード：

import csv 

FileOne = open('/FileOne') 
FileOneReader = csv.DictReader(FileOne) 

FileTwo = open('/FileTwo') 
FileTwoReader = csv.DictReader(FileTwo) 


for row in FileTwoReader: 
    for row2 in FileOneReader: 
     if row['FirstName'].lower() in row2['FirstName'].lower(): 
      print 'Name:' + row['FirstName'] + ' Age: ' + row2['Age'].lower()

出典

2017-01-12 marksman

理由があります。あなたのファイルの1つは、2回目の繰り返しで使い果たされます。リストにデータを保存し、そのようにチェックする必要があります。 – Abdou

CSVファイルが不審です。 [CSV形式の定義]（https://tools.ietf.org/html/rfc4180#section-2）を参照してください。 row2 ['FirstName']。lower（）： 'これに'行['FirstName']。lower（）== row2 ['FirstName']の場合は、この '' FirstName ' .lower（）： 'あなたのデータを整理した直後。 –

最初の反復で（iteratorある）全体csv.DictReaderオブジェクトを読んでいるので、第二の一方が印刷されていない理由です。 2回目の反復では、iteratorsのいずれかが使い果たされているため、何も返されません。

リストにデータを保存し、そのようにチェックする必要があります。

# Use with statements whenever you're working with more than one file 
with open('full_names.csv') as fileone, open('first_names.csv') as filetwo: 
    full_table = list(csv.DictReader(fileone)) 
    small_table = list(csv.DictReader(filetwo)) 
    for row1 in full_table: 
     for row2 in small_table: 
      if row2['FirstName'].lower() == row1['FirstName'].lower(): 
       print('Name: ' + row2['FirstName'] + ', Age: '+ row1['Age'].lower())

これは得られるはず：

# Name: Jane, Age: 34 
# Name: Robert, Age: 27

full_namesをここでガイドです。CSVは含まれています

FirstName,LastName,Age 
John,Doe,45 
Jane,Doe,34 
Robert,Smite,27 
Bob,White,56 
Cary,Woods,28

first_names.csvは含まれています。あなたが最初の繰り返しで全体 `csv.DictReader`オブジェクトを読んでいるため、2番目の1が印刷されていない

FirstName 
Robert 
Jane

出典

2017-01-12 19:50:35 Abdou

これは私のために働いたが、if文の '=='を 'in'に変更しなければならなかった。ありがとう！ – marksman

これはパンダと非常に簡単です！

pandasで両方のcsvファイルをインポートし、2番目のcsvを最初のものとマージして、目的の変数を選択します。

import pandas as pd 
df1 = pd.DataFrame([['A', 'LastA', 30], ['B', 'LastB', 20], ['C', 'LastB', 10]], 
        columns=['FirstName', 'LastName', 'Age']) 
df2 = pd.DataFrame([['A'], ['B']], 
        columns=['FirstName']) 

df2.merge(df1, on='FirstName')[['FirstName', 'Age']] 

## -- End pasted text -- 
Out[7]: 
    FirstName Age 
0   A 30 
1   B 20

出典

2017-01-12 19:21:48 rafaelvalle

ありがとうございます。私はパンダについてもっと学びます。 – marksman

Mayebこのようなものですか？

import csv 

FileOne = open('/FileOne') 
FileOneReader = csv.DictReader(FileOne) 

FileTwo = open('/FileTwo') 
FileTwoReader = csv.DictReader(FileTwo) 

names_to_check = [] 

for row in FileTwoReader: 
    names_to_check.append(row['FirstName'].lower()) 

for row in FileOneReader: 
    if row['FirstName'].lower() in names_to_check: 
     print "Name: {} Age: {}".format(row['FirstName'], row['Age'])

出典

2017-01-12 19:27:51

助けてくれてありがとう！ – marksman

Python：2つのCSVリストを比較する

答えて

関連する問題