私はrequests
を使用してウェブページを取得していますが、response.encoding
の自動的に推定されたエンコードは間違っています。私はユニコードのバイトをデコードする必要がありますが、私はこのためのAPIを見つけませんでした。 response.text
はUnicodeですが、バイト配列ではありません。何か案が? the documentationからPythonが異なる文字セットを使用してデコードを要求します
-1
A
答えて
1
(強調追加):あなたが要求を行うと
、リクエストはHTTPヘッダーに基づいて、応答の エンコーディングについて教育推測をします。
r.text
にアクセスすると、Requestによって推測される のテキストエンコーディングが使用されます。あなたはr.encoding
プロパティを使用して、使用している 何エンコーディング要求を見つけると、それを変更することができます:あなたはエンコーディングを変更する場合は、r.text
を呼び出すたび>>> r.encoding 'utf-8' >>> r.encoding = 'ISO-8859-1'
は、要求は
r.encoding
の新しい値を使用します。特別なロジックを適用してコンテンツのエンコーディングがどのようになるかは、 のどのような状況でも実現できます。 たとえば、HTTPとXMLには、 があり、そのエンコーディングを本文に指定することができます。 のような状況では、r.content
を使用してエンコードを探し、次に をr.encoding
に設定する必要があります。これにより、正しい エンコーディングでr.text
を使用できます。
関連する問題
- 1. SonarQube - 異なる文字セットを使用してOracleに接続する
- 2. golang HTML文字セットのデコード
- 3. phpを使ってbase64文字列をデコードし、入力文字セットを選択するには?
- 4. Sparkを使用してバイナリファイルのセットをデコードする
- 5. dllimportを使用した複数のパラメータの異なる文字セット
- 6. open-uriを使用してデフォルトの文字セットを指定しますが、サーバ提供の文字セットを使用する場合は
- 7. HTML5文字セット文字エンコーディング宣言:スペイン語文字を使用する必要がありますか?
- 8. PHP/JSONの文字セットのデコード
- 9. Javaの文字セットのデコード問題
- 10. JPA with EclipseLink:デコード文字セット問題
- 11. URL文字列を使用して要求インスタンスを作成するLaravel
- 12. ESC文字を使用してGSM 03.38拡張文字セットにアクセスする
- 13. PythonでHTML文字列をデコードする
- 14. Excelスプレッドシートでの文字エンコーディング(およびそれをデコードするために使用するJava文字セット)
- 15. Pythonが奇妙な文字をデコードする
- 16. のpythonを使用して、要求を行うPythonの
- 17. kvmバルーンドライバが異なる合計メモリを要求しました
- 18. HTML文字をデコードするAngularJs(不要)
- 19. Python - 文字セットを検出してutf-8に変換する
- 20. Mod Security - xmlを使用して本文を要求する
- 21. $ http.post(angular)とbodyparser.text()を使用して文字列要求を送信すると、要求の本体がオブジェクトとして戻ってきますか?
- 22. Pythonはログファイルから文字列をデコードします
- 23. phpには異なる文字セットが含まれています
- 24. Pythonは16進文字列の予期しない動作をデコードします
- 25. UTF-8文字セットを使用している場合は、特殊文字にHTMLエンティティを使用する必要がありますか?
- 26. JavaScriptを使用してテキスト領域の文字セットを検出します。
- 27. は、HTTPSリクエスト私はPythonの要求ライブラリーに 私のコードを使用してHTTPS要求を送信しようとしていますPythonの要求ライブラリ
- 28. Pythonはパラメータを使用してURLで呼び出しを要求します
- 29. PHPはANSI文字をデコードします
- 30. Pythonがエラーを要求します
.contentとdecodeを使用します。 –