内容がすべて中国語(ヘッダを除く)のcsvファイルがあります。私は(COLヘッダーはキーである)辞書としてファイルを読みたいので、私は次のようでした:utf-8 csv中国語ファイルをPythonで読む方法
import csv
d = csv.DictReader(open('file.csv', 'rU')
final = []
for row in d:
final.append(row)
しかし、私は値にアクセスしようとすると、値がすべて破壊され、次のように現れています
'\xe4\xb8\x8a\xe6\xb5\xb7\xe5\xba\xb7\xe8\xa1\x8d\xe6\x8a\xa4\xe7\x90\x86\xe7\xab\x99'
したがって、file.csv
は、元々はExcelで作成され、xlsxとして保存されましたが、後でcsvファイルとして保存されたUTF-8 csvファイルです。このファイルをPython 2.7でどのように読むことができますか?
こんにちは、私はmy_byte.decode( 'utf8')を試しましたが、結果は 'u4e0a \ u6d77 \ u5eb7 \ u884d \ u62a4 \ u7406 \ u7ad9 '、これは正しいですか? – song0089
@ song0089はい、それはユニコード文字列のreprです。テキストが使用されている場所であればどこでも使用できます。それをターミナルに印刷すると、中国語のグリフとして表示されるはずです。GUIにしたければ、それはユーザーにとって適切なものをレンダリングしなければなりません。 –
https://nedbatchelder.com/text/unipain.html –