2017-11-27 120 views
0

train.tsv.7ztest.tsv.7zというデータセットがあります。私はunadiver(ダブルクリック)で私のMacでそれらを解凍するので、私は今train.tsvtest.tsvを持っています。tsvファイルのPandasでデータをトークン化する際のエラー

その後、私は

PATH='data/projData/' 
tables = pd.read_table(PATH) 

を使ってパンダとそれらのファイルを読んでいます。しかし、私は他のstackoverflowのスレッドを見ると、エラー

ParserError: Error tokenizing data. C error: Calling read(nbytes) on source failed. Try engine='python'. 

を取得しています、エラーが破損しているファイルが原因であると思われます。しかし、どのようにこの問題を解決するか分からない。

python3.6 conda環境を使用しています

答えて

1

この方法では動作しません。あなたは、単一のファイル(ディレクトリではない)を指定する必要が

train = pd.read_csv('data/projData/train.tsv', sep='\t') 
関連する問題