2012-04-04 5 views
-1

私はいくつかのJavaスクリプトタグを含むHTMLファイルを持っています。このファイルをIEなどのブラウザで実行すると、一部のコンテンツがソースからキャッシュされ、ブラウザに表示されます(たとえば、一部の都市の天気など)。このhtmlファイルを実行して、Webブラウザに表示されたWebページの内容を取得するにはどうすればよいですか?私は自分のアプリケーションにコンテンツを表示したくありません。私は返されたデータを解析し、いくつかの特別な内容を抽出したいと思います(例えば、各都市の天気を抽出します)。 誰も私を案内できますか?java:get html contents

+0

この質問はあまりにも非特異的であり、それはseeemsとして、Javaのとは何の関係もありません。私は 'java'タグを切り捨てました – HerrSerker

+0

私は、Javaアプリケーションがサーバーでそれを使用したいと思っています。私は入力を取得し、サイトから取得したデータを返します。私は、Webサーバーから受信したHTMLファイルやコンテンツを解析し、お気に入りのタグを抽出するためにJavaライブラリが必要です。だから私の質問は、Javaについてです! – sajad

答えて

1

あなたがしようとしていることは、htmlスクレイピングと呼ばれています。

あなたにとって最良の選択肢は、コンモンや複雑な作業であるため、ライブラリの形でヘルプを得ることです。

は、この質問を参照してください:Options for HTML scraping?

0

セレンは良い賭けです。他のブラウザの中でHtmlUnit、Firefox、Chromeをサポートしています。

リンク:http://seleniumhq.org/

関連する問題