私はread_csv
にキリル文字を含むCSVファイルをpandasとしようとしています。ここでpython pandas read_cvs load utf-8
import pandas
data = pandas.read_csv('dataset.csv', delimiter='\|\|', engine='python', encoding='utf-8')
print type(data.name[0])
<type 'str'>
、私は私が間違って何をやっているunicode
print type(u'hello')
<type 'unicode'>
と同様に得ることを期待していますか?
Pythonはカモに型指定されています。あなたは決してオブジェクトがどんなタイプであるか尋ねるべきではありません。これは、あなたが持っているものとあなたが望む出力が何であるかを示す何らかの例を提供する必要があると言われています。あなたのコードは正しく表示されますAFAIK – firelynx
pandasが 'read_csv'メソッドをどのように実装しているのかわかりませんが、std.libを使用しています。 Python 2の 'csv'はファイルの解読をサポートしていないので(おそらく実際には悲しいです)、これに対する解決策は簡単ではありません。今やPython 3に切り替えるもう一つの理由! – lenz