2017-08-15 6 views
2

私はFacebookページをスクロールしようとしています。これはセレンとPythonを使ってページを気に入った人のリストを提供しています。 URLの形式はhttps://www.facebook.com/search/page_id/likersです。ここで、page_idは各Facebookページの一意の番号です。セレンはクラッシュのようなFacebookのページをスクロールします

私は下にスクロールしようとしているページは約18k好きで、スクロールダウンプロセスを自動化すると、約700-800人に達するとプログラムがクラッシュします。なぜこれが起こっている誰も私を助けることができる

Message: unknown error: session deleted because of page crash 
from unknown error: cannot determine loading status 
from tab crashed 
    (Session info: chrome=58.0.3029.110) 
    (Driver info: chromedriver=2.26.436382 (70eb799287ce4c2208441fc057053a5b07ceabac),platform=Linux 4.10.0-32-generic x86_64) 

:?ここ

はエラーメッセージですか

+1

を使用してタイムアウトを増やすことができ_「しようとしていますページが好きな人のリストを表示するFacebookページを下にスクロールする "_ - 何のために...? Facebookが自動的にそのデータにアクセスしたければ、APIを介して公開します。そのようなオートメーションを使用することは、ToSの違反です。 – CBroe

+0

@CBroe私は他の誰かのデータを盗んでいません。私は、手作業を自動化して自分のページを好きな人のリストを取得しようとしています。それは違反ですか? –

+0

あなたはそのリストで何を望んでいますか?自分のページやそのようなものが好きだったからといって、人に連絡することはできません。 – CBroe

答えて

0

これはどれくらいかかりますか?

セレンはそれがthis postを参照してください、エラーを返します指し示すた後にデフォルトの待機時間があります

あなたは30分のマークをヒットしている場合は、

driver.set_page_load_timeout(long_wait_time) 
+0

ありがとうございますこれは動作します。しかし、html = driver.page_sourceを使用してhtmlを取得しようとすると、もう一度クラッシュします。あなたはなぜ電話することができますか? –

+0

多くのことがありますが、私にエラーを表示できますか?もし私が推測しなければならなかったのは、page_sourceが巨大で(30分以上データを収集していたため) –

+0

私はこのエラーがhtml = driver.page-source ' selenium.common.exceptions.WebDriverException:メッセージ:不明なエラー:ページがクラッシュしたためセッションが削除されました 不明なエラーが発生しました:ロード中のステータスを確認できません タブからクラッシュしました –

関連する問題