2016-10-11 6 views
2

フォルダ内に200個ほどのファイルのリストがあります。それぞれの列の量は同じですが、名前に多少のバリエーションがあります。たとえば、私はグローバルIDまたはグローバルIDまたはグローバルIDを持つことができます。パンダの列名の大文字小文字を制御する方法はありますか?現在は、最初の15個のファイルが200個になり、グローバルIDが見つからないためエラーになります。Python - Pandas複数のファイルを結合する

初心者でまだ学習していることに注意してください。 read_table

import pandas as pd 
import glob 

with open('test99.txt' , 'a') as out: 
    list_of_files = glob.glob('M:\AD HOC Docs\Client\Blinded\*') 
    for file_name in list_of_files: 
     df = pd.read_table(file_name, low_memory=False) 
     df['Client'] = file_name.split("_")[2].strip() 
     Final = df[['Client','ClientID','Global ID','Internal ID','campaign type','engagement type', 'file_name']] 
     Final.to_csv(out,index=False) 
+0

ループして名前を変更しましたか? –

答えて

2

使用header=None, names=[list of column names you want to use]などの追加の引数は、ヘッダー行を無視するようにし、一貫性のある名前を取得します。

+0

OK、私はそれを試すことができます。たとえば、私は間違って余分の列を持つ1つのファイルがある場合はどうなりますか? – WildBK

+0

同じリストをusecols引数に渡す – Boud

関連する問題