URLのリストのタイトルをスクラップするスクリプトが必要ですが、ページ全体が読み込まれるまで待つ必要がある場合は非常に遅くなる可能性があります。タイトルは私が探している唯一のものです。Selenium Python:head/titleが読み込まれたときにページの読み込みを停止する方法は?
タイトルの読み込み時にページの読み込みを停止できますか?おそらくEC.title_containsのようなもので。
URLのリストのタイトルをスクラップするスクリプトが必要ですが、ページ全体が読み込まれるまで待つ必要がある場合は非常に遅くなる可能性があります。タイトルは私が探している唯一のものです。Selenium Python:head/titleが読み込まれたときにページの読み込みを停止する方法は?
タイトルの読み込み時にページの読み込みを停止できますか?おそらくEC.title_containsのようなもので。
セレンの機能にpageLoadStrategyを設定してみましたか?
あなたはこのスレッドでは、それについての詳細を読むことができます - Page load strategy for Chrome driver
と
http://webdriver.io/guide/getstarted/configuration.html - それはFirefoxのみで利用可能ですが、今ではすべてのブラウザのために利用可能であるべきであると言う時代遅れビット。
問題は、例としてwebdriver.ioがページが完全に読み込まれ、タブの読み込みタイマーがなくなるまで待ちます。多くの場合、.getTextのようなAPIの多くは、完全なページがロードされるまで動作していないため、正当な理由があります。例として、要素が最後にロードされることがあるためです。 しかし、あなたはでロード時間を短縮することができます:あなたはjavascriptのインラインまたは外部ですべてをブロックするスクリプトの安全やその他の単純なスクリプトブロッカーのような拡張機能を使用
1.。
2.クロム設定に行き、Cookie、javascript、flashなどのすべてを無効にします。
3.移動クロムへ://フラグとJavaScript(ゲームパッドAPIなどのように、すべてのAPI's)からキャンバスなどのWebGL、にすべてを無効にする - あなたは本当に私はまた、クロムを持っているすべてを無効にすることができます私はすべてを無効にしたプロファイル。
通常のインターネット速度と優れたCPUでは、すべてのサイトを1〜3秒で開くことができます。
また、ヘッドレスブラウザを試すこともできます。