私はテキストファイルから会社名を取り、検索エンジンのWebサイト(SECのEdgar検索)で検索するプログラムを作成しようとしています。それぞれの検索では、通常、1〜10のユニークな検索結果リンクが表示されます。そのため、カールを使用して関連する会社名のリンクをクリックします。リンクページには、「組込みの状態:」という用語と州名が記載されています。私は州の名前を解析しようとしています。 HTML解析とカールとそのクラスの使い方を理解できません。私は、ステップの簡単な概要や、ちょっとしたアドバイスなど、可能な限りの助けに感謝します。ありがとう。このタスクのためにJAVAでhtmlparsingとカールを使用する方法...?
1
A
答えて
1
HTMLがかなり基本的であると仮定すると、Mozilla Java HTML Parserのようなものを使用します。 getting started guideは、DOMの作成の詳細を示します。 JavaにはWebからコンテンツをダウンロードするためのbuiltin APIsがあり、 "curl"を使用するのではなく、これで十分です。
DOMを取得したら、標準のDOM APIを使用して、必要なリンクやアイテムをナビゲートできます。
関連する問題
- 1. PHPでカールを使用する方法?
- 2. カール要求情報を受信するために、このカール要求を行うためにそのドキュメンタリーで
- 3. Javaで進捗モニタを使用するためのタスクを作成する方法は?
- 4. ネストされたタスクで子タスクを使用する方法
- 5. メールの受信をテストするためにカールを使用することができます
- 6. カールのための反応と軸の使用
- 7. このためにAppサービスプロバイダを使用する方法
- 8. POSTの代わりにカールGETを使用する方法
- 9. 「テンポラリの使用」と「ファイルの使用」を削除するためにこのクエリを改善する方法
- 10. GruntタスクでのjQueryの使用方法
- 11. シェルでカールを使用してコンテンツタイプをチェックする方法
- 12. Jni4net、Javaで使用するためにC#イベントを定義する方法
- 13. Oracle RDBMSで使用するためにJAVAを学習する方法
- 14. カールでhoundify APIを使用する方法
- 15. PATCH動詞をカールで使用する方法
- 16. System.Configuration.Install.Installerをスケジュールされたタスクで使用する方法?
- 17. タスク制御間違ったコミットメッセージは、私はSVNを使用するために使用される、と私は例えばコミットメッセージ、タスクの数を追加することで、タスクを追跡することができ
- 18. javaとglassfishで日々のスケジュールされたタスクを実装する方法は?
- 19. 'wget -O'のカール置換え、またはカールでターゲットファイルを定義する方法
- 20. 断片のダウンロード進捗ダイアログのための非同期タスクの使用方法?
- 21. PHPとカールは、私たちのURLに関するつぶやきの数を取得するためにカールを使用してPHPスクリプトを持って
- 22. キャンバスレストパイのカールを使用してPUT命令を使用する方法
- 23. jqGrid目的または任意のタスクのためにObjectContextを使用して編集する方法
- 24. URLConnectionを使用して--verboseスイッチでカールするJava
- 25. SharePoint 2010のワークフローで親タスクを使用してタスクをグループ化する方法
- 26. アタスクapiを使用すると、タスクを更新する方法
- 27. Javaでgetterとsetterメソッドを使用する方法と使用方法
- 28. 着信のためにtokboxでpubnubを使用する方法
- 29. トレーニングのためにTensorFlowセッションでデータセットを使用する方法
- 30. Vertx Java - mongoclientを使用して複数のドキュメントを更新するためにcompositefutureを使用する方法