私はウェブスクレイピングの初心者です。私はCOCAからいくつかのデータを掻き集めるこの小さなプロジェクトを持っていますが、私はどこから始めるべきか分かりません。このWebページはJavascriptを使用して構築されているようですが、私はそれと対話できるパッケージがあるのだろうか?ここでPythonを使用してJavaScriptウェブページとやりとりする方法は?
は、私は私のプログラムがしたいいくつかのタスクです:
- ログ1のアカウントを使用して、
- タブを選択します(例:検索、グラフなど、COCAを参照してください)。
- あなたが教科書で検索したい単語のタイプ。
- 検索結果をスクラップします。
ご意見をいただければ幸いです。
PS:理想的にはすべてがバックステージで動作するはずです(ブラウザは開かない)。
[selenium](http://www.seleniumhq.org/)もあり、ウェブサイトでjsを実行することもできます。 – Marcin
またはhttp://phantomjs.org – user1775888
@Marcin返信いただきありがとうございます。はい、セレニウムを調べましたが、私のプログラムでブラウザを開くのは嫌です。理想的には、すべてが舞台裏で機能します。なにか提案を? – Bayesric