2017-02-11 5 views
0

私はデータ科学のためにPythonを学び始めました。私はすでにほぼ毎日Rを使っています。私は最初のステップでスタックする。私は、Pandasのread_csvファイルメソッドを使用してcsvファイルをインポートしようとしています。インポート中にファイルのエンコードに問題があります。pandasを使用してPythonでcsvをインポート中にエラーが発生しました

df <- read.csv2("some_path/myfile.txt", stringsAsFactors = FALSE, encoding = 'UTF-8') 

が、私はPythonで同様のコードを使用している場合:私はRのすべてのものからread.csv使用する場合

okです

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc6 in position 13: invalid continuation byte 

import pandas as pd 
df = pd.read_csv("some_path/myfile.txt", sep = ';', encoding= 'utf8') 

は、それがエラーを返します

"utf-8"エンコーディングのファイルをRにはインポートできますが、Pythonではインポートできないのはなぜですか?

異なるエンコード(latin1またはiso-8859-1)を使用すると、ファイルは正常にインポートされますが、文字は正しい方法でエンコードされません。

+0

私は 'cp1250'エンコーディングがうまく動作すると思います。 – Mislav

+0

問題をよりよく理解するために、あなたの 'myfile.txt'のサンプルを表示してください。 –

答えて

0

UTF-8がRではなくPythonで動作する理由が分からないとしても、cp1250エンコーディングがうまく動作することがわかりました。

-1

エンコーディング "UTF-16"を使用してください。私は同じエラーで私の問題を解決するためにそれを使用しました。

+0

あなたは 'utf-16 'を使ってあなたの問題を解決したということを意味しますか、それともあなたに同じ問題を依然として与えているのですか? – Simon

関連する問題