Jsoup
htmlパーサー(例:名前、都市名、州、郵便番号など)を使用して、異なるウェブサイトからデータを読み込む必要があります。私は1つのウェブサイトからデータを読むことができます。問題は私のコードを他のウェブサイトに再利用できることです。他のウェブサイトの要素とその位置は最初のウェブサイトとは異なります。これを達成する方法。任意のパターンや例をお勧めします。ありがとう。異なるHTMLのページ(または)ウェブサイトからデータを読み込む例
答えて
私はこれをあなたのためにまっすぐにします。一般的なパーサーを使ってすべてのウェブサイトを削ってはいけません。私は30のウェブサイトを掻き分けなければならなかった会社に勤めました。そして、私は文字通りすべてのウェブサイトのために1つを書く必要がありました。
ただし、は、解析したデータをで処理するのに役立つ一般的なユーティリティクラスを作成できます。
はい私は知っているが、各ウェブサイトの要素を設定しそこから要素データを読み取るxmlまたはjsonの設定方法は知っている。コードは再利用されるため?? – Harinath
はい、あなたはそれを行うことができます、各Webサイトを検査し、要素セレクタをxmlファイルにマップします。次に、ウェブサイトをスクラップすると、XMLを解析して対応する要素セレクタを取得します。しかし、これはまだあなたが各ウェブサイトを通過する必要があります...もしそれがあなたと大丈夫なら: –
ありがとう@Joel Min。わかった。私は、WebサイトのURLとJsonファイルの要素を設定します。私はそこから読む。コードの多くが減少しました。ありがとう。 – Harinath
http://jsoup.org/はいいドキュメントを持っています –
あなたは正確なリンクを提供できますか? – Harinath