私が掻き取ろうとしているウェブサイトのホームページには、4つのタブがあり、そのうちの1つは「[Number] Available Jobs」と表示されます。私は[数値]値を削ることに興味があります。 Chromeでページを調べると、<span>
タグで囲まれた値がわかります。ダイナミクスをロードするページから値を削る方法は?
しかし、私は直接、ページのソースを表示すること<span>
タグで囲まれたものは何もありません。私は、Python requests
モジュールを使用してHTTP GETリクエストを作成し、正規表現を使用して返されたコンテンツから値を取得することを計画していました。コンテンツに必要な数が含まれていない場合、これは明らかに不可能です。
私の質問は以下のとおりです。
ここで何が起こっていますか?値を動的に ページに読み込んで表示し、HTMLソース内に表示されないようにするにはどうすればよいですか?
値がページソースに表示されない場合は、 にアクセスするにはどうすればよいですか?
セレンを使用することができます:https://pypi.python.org/pypi/selenium – Javier