私は初心者です。私はリンクから投稿とコメントを取得する必要があります。私はこのプロセスを自動化したい。私はこれにwebcrawlerとjsoupを使用することを検討しましたが、webcrawlerは主により深いWebサイトに使用されていると言われました。ページのためウェブページの内容を取得する(AJAX呼び出しでロード)
サンプル:ジャイブコミュニティサイト
このページでは、私は、ページのソースを表示するとき、私は唯一のポストではなくコメントを見ることができます。コメントはサーバーへのAJAX呼び出しを介して取り出されるため、これが考えられます。
したがって、jsoupを使用すると、コメントをフェッチしません。
投稿やコメントを取得するプロセスを自動化するにはどうすればよいですか?
すべてのコメントは、jive Databaseから読み込まれます。コメントの生のテキストを取得するための隠しリンクはありません。私が検索したリンクがあるはずです(Javaスクリプトを知っていれば、ここから呼び出すことができます:https://www.heylululemon.com/6.0.2.0/resources/scripts/gen/b0e45f40028721e48611c14803fef20d.js)コメントを得るためにサイトから呼び出されますが、私は見ませんでした。あなたはウェブビュー機能を試しましたか? – ImGeorge
[Jsoup Java HTMLパーサー:JavaScriptイベントの実行]の可能な複製(http://stackoverflow.com/questions/7344258/jsoup-java-html-parser-executing-javascript-events) – Pshemo