私の大学のウェブサイト(moodle)をnode.jsで削りたいが、ヘッドレスブラウザが見つかりませんでした。私はPythonでRoboBrowserを使ってわずか10行のコードでこれを行っています:node.jsで認証されたウェブサイトを掻き立てる
from robobrowser import RoboBrowser
url = "https://cas.upc.edu/login?service=https%3A%2F%2Fatenea.upc.edu%2Fmoodle%2Flogin%2Findex.php%3FauthCAS%3DCAS"
browser = RoboBrowser()
browser.open(url)
form = browser.get_form()
form['username'] = 'myUserName'
form['password'] = 'myPassword'
browser.submit_form(form)
browser.open("http://atenea.upc.edu/moodle/")
print browser.parsed
問題はウェブサイトが認証を必要とすることです。手伝って頂けますか?ありがとう!
PD:これは役に立ちますhttps://www.npmjs.com/package/form-scraperしかし、私はそれを働かせることはできません。
http://casperjs.org/ – robertklep