Java - ウェブページからのテキストを取得

私はJavaで試みたことのない新しいプロジェクトを開始しています。私は手で事前に研究しています。私の研究は、私が始めた場所よりもはるかに私を得ていません。Java - ウェブページからのテキストを取得

ウェブサイトを検索し、対応するデータは、（基本的にはユーザーの入力は、その後、対応する結果を返すクエリのもとその検索エンジンの検索）を取得：

は基本的に私のプロジェクトは、これを行います（値は0になり
ユーザが結果のいずれかをクリックすると、プログラムは、特定
値を示します結果のWebページ）

は、これまでのところ、私は一種のこれを行う方法について知っているすべては、Webスクレイピングです。私は例を見つけることができなかったので、私はまだこれについて暗闇の中にいます。

これは本当に可能ですか？私はAndroid SDKでJavaを使用します。私は一種のアイデアを持っていますが、私のJavaの知識等、高度で

おかげで、もちろんブランドン

2011-05-06 Brandon

Nutchはすばらしいツールですが、小規模なプロジェクトでは少し過剰すぎるかもしれません。あなたが本当に迅速かつ汚いと理解しやすい何かを探しているなら、あなたはcrawler

あなたはおそらく、あなたのプロジェクトにこれをドロップすることができ、10分でこすること

2011-05-06 01:58:14 mkoryak

ありがとうございます。両方を調べる – Brandon

ことが可能であるとのWebページとは何が含まれていません。おそらくこれのための最良のライブラリはApache Nutchです。 Luceneのような強力なライブラリスタックに基づいており、非常に成熟しています。チュートリアルを見ると、簡単なポップアップに必要なすべての情報を見つけることができます。

2011-05-06 01:52:27

答えて