私はこれが繰り返される疑問であると理解しますが、解決策を見つけるのが難しいです。要するにPython 3デコードストリング
私はデコードしたい文字列を持っている:
文字列'"my quote"'
ノートの最後の点から期待さ
raw = "\x94my quote\x94"
string = decode(raw)
は、私は、Python 3で働いているということですのでraw
ですしたがって、既にデコードされている。それで、"\x94"
文字を「デコードする」ために正確に何をする必要がありますか?
は、あなたのウェブサイトのスクレイピングは、Unicodeにデータを復号化するために、間違ったエンコーディングを使用していました。理想的には、結果の代わりにウェブサイトを読むコードを修正します。それ以外の場合は、誤って適用されたエンコードでエンコードして問題を取り消し、正しいものでデコードします。 –
私はちょうど 'urllib.request.urlopen'を使用しています。要求がどのようにデコードされるかを変更するオプションはありません。私の選択した答えで指摘されているように、私の直面する問題の解決策は "latin-1"でエンコードし、次に "windows-1252"でデコードすることでした。これは妥当なアプローチですか、それともルートの問題を解決する方法がありますか? – rmorshea
これは妥当なアプローチですが、コードを再現可能な例で見ることなく、Webサイトを参照することはできません。 –