を要求しますあると呼ばれる。は、PythonでHTTP経由でダウンロードしたリソースのトレースを維持することは、オープンクロームコンソールを維持しながら、私はen.wikipedia.org/wiki/Hello</em><em>を訪問モジュール
GET https://en.wikipedia.org/wiki/Hello -> 200
、その後、他の多くのHTTP要求が処理されます。を.pngのウィキペディアのロゴを、いくつかのCSS、スクリプトやその他のファイルには、私のブラウザにダウンロードされ、一緒に彼らは、実際のページをレンダリングウィキペディアrequests
で
は、私は同じことをしたい:シンプル
requests.get("https://en.wikipedia.org/wiki/Hello")
は私にこんにちはページのHTMLドキュメントを返しますが、それ以外のリソースがダウンロードされません。
ページをレンダリングするために開いた接続数とダウンロードされる要素のトレースを保持したいと思います。上記のGETリクエストは画像、CSS、またはスクリプトを返しません。
私は何か重要なことを忘れていると思います。ウェブページを完全にロードするために必要なリソースは誰が知っていますか?
私は(requests
で)どのリソースがダウンロードされていて、どれだけの接続が取得されたかを知りたいので、これを求めています。
私はサーバーがページを読み込む必要があることを知っているサーバーだと思うので、サーバーはこの情報をクライアントに伝える必要がありますが、どこにいなくなっていますか:HTTPリクエストヘッダーで何も見つかりませんでした。
私はこのリスト/辞書/ JSON /ページを完全にレンダリングするのに必要なリソースが必要なので、私は手動でPythonでそれを行うことができます。