私はUbuntuとPython 3.4を使ってwikipediaのapiからデータをダウンロードしています。私は名前を保存していますが、異なる言語の文字が正しく保存されていないことがわかりました。utf-8 pythonへの変換
たとえば、日の火曜日はæ¥ã®ç«ææ¥で保存されます。
私はそう、私は
fd = io.open("filename",'w',encoding='utf8')
fd.write(str(name.encode('utf-8'), 'utf-8'))
に私のコードを変更しかし、私はまだ同じ結果を得る私はUTF-8で保存することはできません考え出しました。
私が使用しているAPIはhereです。
私が今まで理解していることは、utf-8はすべての言語のテキストを処理できなければならないということです。また、Ubuntuのコンソールにはデフォルトでutf-8があり、more
のようなコマンドを実行すると文字列が正しく出力されるはずです。
どのようにしてデータをPythonに集めていますか?これは 'urlopen()'を通してですか?私はちょうどあなたのリンクに 'urlopen()'を使い、出力をファイルに保存しました。うまくいきました。 – Abdou
ありがとうございます。私はこれをやっています: 'urllib.request.urlopen(url)as url: s = url.read()' –
あなたは単にそれを別のエンコーディングとして解釈している端末ではないと確信していますか? – Bakuriu