2017-11-24 1 views
0

127294行(ヘッダを含む)のタブ区切りのテキストファイルを持っていますが、パンダのデータフレームに読み込もうとすると、結果は126674行予想よりも619行少ない)。タブ区切りのテキストファイルを読むときにPandasが黙って失敗するように見える

エラーメッセージ/例外または警告はありません。正しい数の列が存在します。

私はそれを読んでいる:

df = pandas.read_csv("temp", sep="\t") 

答えて

1

私は619行で区切られたファイル内の文字( ")2二重引用符があることを発見したので、エントリを囲むように、デフォルトの扱い引用によってパンダ。それは次の引用に達するまでは、そのエントリ内のすべてのタブ、改行が含まれて

私が(行の正しい#で)望んでいたように私は、ファイルを読むことができました:。

df = pandas.read_csv("temp", sep="\t", quoting=csv.QUOTE_NONE) 

また、ファイル内で引用符を使用することが重要だった場合は、そのエントリを囲むようにファイルを編集することもできました。

関連する問題