python 3.5(Beautifulsoup)を使用してWebサイトをスクラップしています。私はソースコードのすべてを読むことができますが、私は(スクリプトへの参照である)成功なしでdisqusから埋め込まれたコメントを取得しようとしています。pythonを使って別のWebページに埋め込まれたコメント(disqus)を取得する
htmlコードのソースの一部は、次のようになります。
var disqus_identifier = "node/XXXXX";
script type='text/javascript' src='https://disqus.com/forums/siteweb/embed.js';
srcはスクリプト機能に送信します。
私はseleniumを使用してstackoverflowの提案を読んだことがありますが、これは成功しないようにするのは本当に苦労しました。私はセレンがブラウザをエミュレートすることを理解しています。しかし、Webdriversに問題があり、正しく動作していません。だから、私はこのオプションを落としました。
私はこのスクリプトを実行して、そのコメントで.jsを取得したいと考えています。 私は可能な解決策がPyV8であることを発見しました。しかし、私はPythonでインポートすることはできません。 私はインターネットの記事を読んで、私はそれを見つけましたが、うまくいきません。
私は崇高なテキスト3をインストールし、私は手動でpyv8-win64の-P3をダウンロード:
C:\ Users \ユーザーmyusernameと指定\のAppData \ローミング\崇高テキスト3つの\インストール済みのパッケージ\ PyV8 \ pyv8-win64の-P3
しかし、私は入れません:
ImportError: No module named 'PyV8'.
を誰かが、私は非常に非常に感謝するよ、私を助けることができる場合。
私はそれを行う方法を発見しました。私は、埋め込まれたフレーム(Javaスクリプトで行われているものの1つ)を指すURLを構築し、それを解析するのに十分です。 – pacode