2016-12-12 61 views
1

二重引用符を含むCSVファイルを読むと、CParserErrorが発生します。このエラーを回避し、CSVファイルを正しく読み込むにはどうすればよいですか?pandas.read_csvで二重引用符をエスケープ

実際に読み込むのに似たファイルがたくさんあるので、私はCSVファイルを編集できないとします。

my.csv

abc,",def 

csv_loader.py

import pandas as pd 
pd.read_csv("my.csv") 

CParserError: Error tokenizing data. C error: EOF inside string starting at line 0

答えて

2

ソリューションは、区切り文字と同じにquotecharに設定されたエラーメッセージは、github issue 5500を参照してください。

import pandas as pd 
from pandas.compat import StringIO 

temp=u"""a,b,c 
abc,",def 
""" 
#after testing replace StringIO(temp) to filename 
df = pd.read_csv(StringIO(temp), quotechar=',') 
print (df) 

    a b c 
0 abc " def 
関連する問題