私は特定のパスでウェブサイトを横断し、そこから情報を抽出する必要があります。以下は、高レベルのアクションです。誰かが私は、Webクローラーが必要か、私はHttpClientをまたはJDKの組み込み機能を使用して、この流れをコード化したほうが良いよなら、私に知らせることができた場合に感謝しています。特定のリンク上のフォーム(HTTPへの遷移(複数可))を使用して、ウェブサイト は、認証されたWebサイトの特定のパスを通過します。 Webクローラーまたは標準のHttpClient?
- ゴー
- クリック(トランジションバックでhttp)
- フォームデータを入力し、をクリック検索ボタン
- ウェブサイトでは、各検索結果にリンクしている から
- 抽出データを一度に検索結果1ページ
- クリックを返します。
- すべての検索結果が読み取られるまで、手順6と7を実行します。
これはクローラで行うことができます。私はJavaに慣れていないので、perlですが、HttpClientでその一部を実行できるように見えます – perlsufi