0
train.tsv.7z
とtest.tsv.7z
というデータセットがあります。私はunadiver(ダブルクリック)で私のMacでそれらを解凍するので、私は今train.tsv
とtest.tsv
を持っています。tsvファイルのPandasでデータをトークン化する際のエラー
その後、私は
PATH='data/projData/'
tables = pd.read_table(PATH)
を使ってパンダとそれらのファイルを読んでいます。しかし、私は他のstackoverflowのスレッドを見ると、エラー
ParserError: Error tokenizing data. C error: Calling read(nbytes) on source failed. Try engine='python'.
を取得しています、エラーが破損しているファイルが原因であると思われます。しかし、どのようにこの問題を解決するか分からない。
python3.6 conda環境を使用しています