私はデータ科学のためにPythonを学び始めました。私はすでにほぼ毎日Rを使っています。私は最初のステップでスタックする。私は、Pandasのread_csvファイルメソッドを使用してcsvファイルをインポートしようとしています。インポート中にファイルのエンコードに問題があります。pandasを使用してPythonでcsvをインポート中にエラーが発生しました
df <- read.csv2("some_path/myfile.txt", stringsAsFactors = FALSE, encoding = 'UTF-8')
が、私はPythonで同様のコードを使用している場合:私はRのすべてのものからread.csv使用する場合
okです
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc6 in position 13: invalid continuation byte
:
import pandas as pd
df = pd.read_csv("some_path/myfile.txt", sep = ';', encoding= 'utf8')
は、それがエラーを返します
"utf-8"エンコーディングのファイルをRにはインポートできますが、Pythonではインポートできないのはなぜですか?
異なるエンコード(latin1またはiso-8859-1)を使用すると、ファイルは正常にインポートされますが、文字は正しい方法でエンコードされません。
私は 'cp1250'エンコーディングがうまく動作すると思います。 – Mislav
問題をよりよく理解するために、あなたの 'myfile.txt'のサンプルを表示してください。 –