私は、生のHTMLをスクラップするためにjavascriptをレンダリングするために、私はセレンとphantomjsのようなwebdriverを使用する必要があります。しかし、そうすることは、私のためにjavascriptをレンダリングしません。以下はサンプルスクリプトです。python、selenium:javascriptから生のhtmlを取得できません
誰でも?あなたが言及したよう
from selenium import webdriver
import time
url="http://www.sgx.com/wps/portal/sgxweb/home/company_disclosure/stockfacts?page=2&code=5TG&lang=en-us"
PJ = r'/xxx/MyPythonScripts/phantomjs_mac'
driver = webdriver.PhantomJS(PJ)
driver.get(url)
time.sleep(3)
html=driver.page_source.encode('utf-8')
print html
スクリプト実行の結果はどうなりますか?実行を視覚化するために 'Chrome'や' Firefox'を使用しようとしましたか? – Andersson
まあ、私は 'Total Revenue'のようなテキストを探してみました。それらのすべては私が本当に理解していないJavascriptでちょうどある。私はPhantomJSを使用していますが、ChromeやFirefoxのwebdriversは使用していません。それは言われて、私はまた、Chromeのドライバを試して、結果はまったく同じです – Jake