2009-07-24 8 views
1

私はテキストファイルから会社名を取り、検索エンジンのWebサイト(SECのEdgar検索)で検索するプログラムを作成しようとしています。それぞれの検索では、通常、1〜10のユニークな検索結果リンクが表示されます。そのため、カールを使用して関連する会社名のリンクをクリックします。リンクページには、「組込みの状態:」という用語と州名が記載されています。私は州の名前を解析しようとしています。 HTML解析とカールとそのクラスの使い方を理解できません。私は、ステップの簡単な概要や、ちょっとしたアドバイスなど、可能な限りの助けに感謝します。ありがとう。このタスクのためにJAVAでhtmlparsingとカールを使用する方法...?

答えて

1

HTMLがかなり基本的であると仮定すると、Mozilla Java HTML Parserのようなものを使用します。 getting started guideは、DOMの作成の詳細を示します。 JavaにはWebからコンテンツをダウンロードするためのbuiltin APIsがあり、 "curl"を使用するのではなく、これで十分です。

DOMを取得したら、標準のDOM APIを使用して、必要なリンクやアイテムをナビゲートできます。

関連する問題