2011-05-06 11 views
0

私はJavaで試みたことのない新しいプロジェクトを開始しています。私は手で事前に研究しています。私の研究は、私が始めた場所よりもはるかに私を得ていません。Java - ウェブページからのテキストを取得

  • ウェブサイトを検索し、 対応するデータは、(基本的にはユーザーの入力は、その後、 対応する結果を返すクエリ のもと その検索エンジンの検索)を取得:

    は基本的に私のプロジェクトは、これを行います(値は0になり

  • ユーザが結果 のいずれかをクリックすると、プログラムは、特定
    値を示します 結果のWebページ)

は、これまでのところ、私は一種のこれを行う方法について知っているすべては、Webスクレイピングです。私は例を見つけることができなかったので、私はまだこれについて暗闇の中にいます。

これは本当に可能ですか?私はAndroid SDKでJavaを使用します。私は一種のアイデアを持っていますが、私のJavaの知識等、高度で

おかげで、もちろん ブランドン

答えて

1

Nutchはすばらしいツールですが、小規模なプロジェクトでは少し過剰すぎるかもしれません。あなたが本当に迅速かつ汚いと理解しやすい何かを探しているなら、あなたはcrawler

になりますここで使用例を参照してください。 http://java.net/projects/crawler/sources/svn/content/trunk/src/examples/com/torunski/crawler/examples/ExampleDownloadWithHTMLParser.java?rev=429

あなたはおそらく、あなたのプロジェクトにこれをドロップすることができ、10分でこすること

+0

ありがとうございます。両方を調べる – Brandon

0

ことが可能であるとのWebページとは何が含まれていません。おそらくこれのための最良のライブラリはApache Nutchです。 Luceneのような強力なライブラリスタックに基づいており、非常に成熟しています。チュートリアルを見ると、簡単なポップアップに必要なすべての情報を見つけることができます。

関連する問題