2011-08-11 1 views
3

私はページを保存してからlxml.html.parse()を使うことを期待していますが、開かれたページから直接行うことができるかどうかは疑問でした。可視ウィンドウを生成せずにSelenium/Pythonを使用できますか?それとlxmlを使用できますか?

違いがあれば、私はUbuntuを使用しています。

編集:xpathを直接使用する方法があります(find_element_by_xpath)ので、lxmlは必要ありません。しかし、ページを保存するには、page_sourceメソッドを呼び出すだけです。

+0

からです – deadfish

答えて

2

「可視ウィンドウを生成せずにセレンを使用する」質問に答えるには、容易にウブニューにPyVirtualDisplayを使用できます。

from pyvirtualdisplay import Display 
from selenium import webdriver 

display = Display(visible=0, size=(800, 600)) 
display.start() 

# now Firefox will run in a virtual display. 
# you will not see the browser. 
browser = webdriver.Firefox() 
browser.get('http://www.google.com') 
print browser.title 
browser.quit() 

display.stop() 

コードを使用すると、文書要素と設定値を取得し、すなわちプロセスをフック取得するためのPowerShellを使用することができますthis blog post

関連する問題