2016-12-05 5 views
-1

Imはchromedriverと、このようなページのためseleniumを使用しようとします: http://shironet.mako.co.il/artist?type=lyrics&lang=1&prfid=202&wrkid=2473はセレンページの全負荷まで待てない

問題は、ページが(例えばyoutubeプレーヤーをロードするための仕上げになるまでSeleniumが常に待機していることですそこ)。 私はhtmlソースでしか興味がありませんので、私はこの長い時間を待っていません。 プログラムを待機させないにはどうしたらいいですか?私はpythonを使用しています。あなたが唯一のソースコードを使用する場合は

+0

ウェブページを開くためにどのコードを使用していますか?一般に、driver.get()メソッドは、ページがロードされるまで待機します。 – thebadguy

+0

こんにちは、私は:driver.get(url)、次にdriver.page_sourceを使用します。しかし、私はページロードを待つことを望んでいません。私はソースコードだけを持っています –

答えて

0

いくつかの可能な解決策があります:

1)あなたはurllib didnt work for this websiteを意味するものを明確にしていないとして、あなたの代わりにpython-requestsライブラリを使用しようとすることができます:

使用pip install requestscmd/Terminal

url = "http://shironet.mako.co.il/artist?type=lyrics&lang=1&prfid=202&wrkid=2473" 
page_source = requests.get(url).content 

2)メディアファイルの自動再生を無効にしてください。Firefox Preferences

from selenium.webdriver.firefox.firefox_profile import FirefoxProfile 

profile.set_preference("media.autoplay.enabled", False); 
driver = webdriver.Firefox(profile) 

3)その他の失礼な方法は

from selenium.webdriver.firefox.firefox_profile import FirefoxProfile 

profile.set_preference("javascript.enabled", False); 
driver = webdriver.Firefox(profile) 

(私はあなたが実際に説明した目的のためにこれを必要とするかもしれないとわからない)ページJavascriptを無効にする。しかし、それはいくつかの必要なメディアファイルを削除することができますように注意するですページソースから

0

(私はこのウェブサイトでは動作しませんでしたselenium原因urllibを使用しています)、あなたは実際にセレンはない何かを必要としないので、セレンは唯一のあなたの方法で取得します。 SeleniumでURLを削ってから、単純なHTTP GETを実行します(curlやwgetなどで、urllib2などのプログラミング言語の組み込み関数やPythonのリクエストライブラリ)

HTMLの解析、BeautifulSoupまたはLXMLを見てください。

+0

私はその単純なHTTP要求が働いていたが、そのサイトが原因で私は思ういくつかのjavascriptsで保護されていません。 http://stackoverflow.com/questions/40710396/requesting-web-page-with-python –

+0

認証を使用して保護されていますか?またはスクレイピングから保護されていますか?スクレイピングから保護されている場合は、完全にロードされるまで待つ必要があります。そうすることで、起こっていたスクランブルが解決されたことを確信しています - >セレンを使用し、ページがロードされるのを待って、ソースを見ます。 Sidenote:ドライバ設定で特定のプラグインを無効にすることができます。 exapleでは、私は 'preferences.put(" plugins.plugins_disabled "、新しいString [] { \t" Adob​​e Flash Player "、" Chrome PDF Viewer "});'たくさん。ほとんどのドライバーやほとんどの言語には、同様のものがあります。 – TimoV

関連する問題