2017-10-22 6 views
0

次のコードは、thisページの内容を出力することになっています。Google Scholar検索結果のセレンとPhantomJSによる取得

from selenium import webdriver 
driver = webdriver.PhantomJS() 
link = u'https://scholar.google.co.il/scholar?q=The+Trellis+Security+Infrastructure:+{A}+Layered+Approach+to+Overlay+Metacomputers' 
driver.get(link) 
print driver.page_source 

しかし、それは印刷し、すべてがある:

<html><head></head><body></body></html> 

私はwebdriver.Firefox()の代わりwebdriver.PhantomJS()を使用している場合は、それが動作します。私は上記のコードはうまく動作していたので、PhantomJSが正しくインストールされていることを知っています。これはどういう意味ですか?

答えて

1

どのバージョンのSelenium/PhantomJsをお使いですか? 私は試してみました:

  • セレン3.6.0
  • PhantomJs

この2.1.1:

from selenium import webdriver 

driver = webdriver.PhantomJS(executable_path=r'PathTo/phantomjs-2.1.1-macosx/bin/phantomjs') 
link = 'https://scholar.google.co.il/scholar?q=The+Trellis+Security+Infrastructure:+{A}+Layered+Approach+to+Overlay+Metacomputers' 
driver.get(link) 
print (driver.page_source) 

をし、それが動作します。

+0

同じバージョン!私は再インストールしようとします... – AlwaysLearning

+0

再インストールされ、何も変更されていません... – AlwaysLearning

+1

解決策を見つけました! https://stackoverflow.com/a/34257642/2725810私はこの問題を解決するためにこの答えを受け入れました。 – AlwaysLearning

関連する問題