2017-06-08 24 views
-1

Excelで他の人が改ざんしたCSVファイルを扱っているため、ファイルの最後にカンマ(セパレータ)が追加され、不完全な行が残っています。末尾のカンマを無視して末尾の不完全な行を無視する

もちろん、Pandas/PythonのCSVリーダーは、このようなファイルを処理できません。

私は、誰かがそのような厄介な機能を回避するための既存のソリューションを知っているのだろうかと思っていました。私は一から解決策を書く上での些細なアドバイスに感謝します。

は説明するために:

CSV file contents: 

header1, header2 
1,1 
2,3 
5,8,, 
1 
1 
+1

内容はどうあるべきですか? – stamaimer

答えて

0
def preprocess(filename): 
    with open(filename, 'r', encoding="utf-8") as csvfile:  
     for line in csvfile.readlines[1:]: 
      if ',' in line: 
       yield list(map(int, line.split(',')[0:2])) 
関連する問題