0
楽しいことに、私はHTML文書内でデータを見つける基本的なパーサーを書いています。私は、解析されたファイルの枝を表すための最良の構造を探したい。 "ベスト・ストラクチャ"の基準は次のとおりです。タグの相対位置を簡単に検索し、その内容にアクセスしたいとします。たとえば、 "bodyの3番目のh3タグの後の2番目のイメージ・タグのイメージ"ヘッダー "。どのようなJava APIデータ構造がHTMLツリーに適していますか?
私が探しているタグのタグの最初のレベルを検索し、そのタグに関連付けられているブランチに移動することを期待しています。それがこの質問が探している構造ですが、HTML文書の相対的な場所を見つける良い方法があれば、説明してください。
それは質問です。より一般的には、ツリーデータ構造を表すことができるAPIを介してどのような種類のJava構造が利用可能ですか?
基本的に 'LinkedList' –
マップのマップはツリー構造を表すことができます。私は具体的には 'LinkedHashMap'を使用します。これは、あなたがエントリを反復処理することによって何かの後に何かを見つけることを可能にする挿入順序を維持するからです。 'map.get(" ").get("