ラズベリー3にHTTPプロキシサーバーがあります。 XMLデータはBeautifulSoup(BS)によって分析されます。データに「ASCII」形式の文字しか含まれていないとき、BSは超高速でした。しかし、文字の一部が「ASCII」を超えていた場合、BSは非常に遅くなりました(150kbのXML文字列の場合、10秒以上かかる場合があります)。 また、elementtree構造体とXML.domも試しました。両方とも遅かった。 XML.saxははるかに優れていましたが、私のpython 2.7.13のラズベリー版では、XML.saxは 'ASCII'しか扱えませんでした。私はサックスを使用する前にdata.encode( 'ascii'、 'ignore')を使用する必要がありますが、これも長くかかりました。 私はutf8形式のXML文字列を扱う良い方法があるのだろうかと疑問に思っていますか? Pythonで 'utf-8'エンコーディングを効率的に解析する方法
-1
A
答えて
0
は自動的に応答内容をデコードし、 "文字列" にそれを返すだろうBS
response=requests.post(url)
soup=BeautifulSoup(response.text,'xml')
response.text
で "XML" 応答を分析します。しかしながら、BSは、復号化が成功するまで、異なる可能な復号化方法を試みる。これには時間がかかります。
response.text
前
使用
response.encoding='utf-8'
(私は「ASCII」は、復号方式リストの最初の場所にあり、それは「ASCII」の内容は、高速デコードされた理由だと思います) BSに応答内容の解読方法を伝える。そして、はるかに速く進むでしょう。
関連する問題
- 1. 効率的な方法でvmstatの出力を解析する
- 2. JSONをC#で解析する最も効率的な方法
- 3. Postgresのテーブルを効率的に解析する方法
- 4. google protobuf-js:メッセージを効率的に解析する方法
- 5. データを効率的に解析する方法
- 6. データベーステーブル名をXMLに効率的に保存し、C#で解析する方法
- 7. 効率的で柔軟なバイナリデータ解析
- 8. Rubyで大きなテキストファイルを効率的に解析する方法
- 9. 特定のコンテンツのEvtxファイルを解析する最も効率的な方法
- 10. iOSでHealthKitのHKSampleQuery結果を効率的に解析する
- 11. XMLをダウンロードして解析する最も効率的な方法
- 12. 効率的な方法でXML TO JAVA POJOを構文解析する
- 13. データ解析のループ文を効率的にプリフォームする方法は?
- 14. XMLの深い値を効率的にテストして解析する方法は?
- 15. 効率的な25GBデータのXML解析
- 16. 効率的な解析FIXメッセージC++
- 17. PythonでUTF8エンコーディングを削除する
- 18. xmlデータを効率的に解析するには?
- 19. Xcodeのフレームドロップを効率的に分析する方法は?
- 20. Apache Drillが無効なUTF8文字でJSONファイルを解析する方法
- 21. このスクリプト言語を解析する最も効率的な方法
- 22. Scala Parser Combinators:効率的にCスタイルのコメントを解析する
- 23. Pythonでスパース行列を効率的に追加する方法
- 24. 効率的にPython辞書をC++で構築する方法
- 25. Javaで効率的にする方法
- 26. これを効率的に解決する方法は?
- 27. テキスト解析のコード効率
- 28. Python未知のエンコーディングutf8
- 29. Python UTF16LEファイルからUTF8エンコーディング
- 30. Objective C iOSでの文字列解析が効率的に
'xml.sax.parseString(data.decode( 'utf-8'))'のようなpythonの専門家はいないでしょうか?代わりにユニコードにデコードします。この素晴らしいプレゼンテーションもご覧ください:https://www.youtube.com/watch?v=Mx70n1dL534 – Niloct
sax.parseStringはヘルパー関数であり、parser.parse()とは異なります。 utf-8形式はサポートされていません。これは、saxフォルダの__init__.pyにあります。これは、Unicodeを処理できないcStringIOからStringIOをインポートします。 –
http://stackoverflow.com/questions/1817695/python-how-to-get-stringio-writelines-to-accept-unicode-string – Niloct