私はpython 2.7でurl 'http://www.5min.com/handlers/SitemapHandler.ashx?type=videositemap & page = 1'を解析しようとしています。問題は、urlopenでurlを開いたときに、ソースが表示されず、奇妙な文字が表示されるときです。それはコード化されるかもしれません。pythonで.ashxファイルを解析する
0
A
答えて
1
あなたは.ashxファイルではなくwebserverの応答を解析しています。あなたのブラウザでそのURLを開きます。それはあなたがurlopenで開くときにPythonが見るものです。応答はXML形式であることを行っているように見える実際に
Cache-Control:private
Content-Encoding:gzip
Content-Length:1100193
Content-Type:application/xml
Date:Mon, 11 Jul 2011 20:21:40 GMT
Server:Microsoft-IIS/7.5
Set-Cookie:NSC_bobmztjt-5njo-opjq*80=ffffffff4304fd3345525d5f4f58455e445a4a423660;expires=Mon, 11-Jul-2011 20:23:42 GMT;path=/;httponly
X-AspNet-Version:4.0.30319
X-Powered-By:ASP.NET
X-Server:fmv-m09 - www
:これらは私が応答になったヘッダをしていることから、開口部
。 ElementTree(または好みのもの)でxmlを解析する必要があります。また、サーバーがgzip(ZipFile)としてエンコードされた応答を送信していることにも注意してください。urlopenが許可するかどうかによって、応答が送信される場合と送信されない場合があります。あなたがUrlopenで不器用に見える場合は、応答を解凍するためにpythonのZipFileを使ってみてください。
関連する問題
- 1. Pythonでpflogファイルを解析する
- 2. Pythonでファイルを解析する
- 3. pythonでgettext .poファイルを解析する
- 4. Pythonでmboxファイルを解析する
- 5. Pythonで変数ファイルを解析する
- 6. Pythonでlispファイルを解析する
- 7. pythonでpcapファイルを解析する
- 8. pythonでconfig.iniファイルを解析する
- 9. Pythonでplistファイルを解析する
- 10. Python:ウェブページからファイルをダウンロードする、ashx
- 11. PythonでJSONファイルを解析します。
- 12. BeautifulSoup htmlファイルを解析するpython
- 13. Pythonの.isoファイルを解析する
- 14. jsonファイルの解析 - Python
- 15. PythonでDjangoでJSONファイルを解析する
- 16. Pythonで解析フォーマット文字列を解析する
- 17. Pythonでイベントを再解析するための構文解析
- 18. python - URLを解析する
- 19. PythonでXMLエントリを含むtext/csvファイルを解析する
- 20. マルチファストBLAST結果を含むPythonでxmlファイルを解析する
- 21. Pythonでxmlモジュールを使用してxmlファイルを解析する
- 22. vobjectを使用してdjnago-pythonでvcfファイルを解析する
- 23. PythonでElementtreeでRSSを解析する
- 24. PythonでODFをlxmlで解析する
- 25. Pythonで可変構造のjsonファイルを解析する
- 26. pythonでウェブサイトからjsonファイルを解析する
- 27. Pythonで階層構造ファイル構造を解析する
- 28. このファイルをPythonで解析するには?
- 29. Apache VelocityでXMLテンプレートにPythonファイルを解析する
- 30. PythonでBIG JSONファイルを解析する方法
私にはまっすぐなXMLのようです。 –
あなたが見ている「奇妙なキャラクター」が何であるか教えてください。 – Tremmors