2016-06-01 10 views
0

楽しいことに、私はHTML文書内でデータを見つける基本的なパーサーを書いています。私は、解析されたファイルの枝を表すための最良の構造を探したい。 "ベスト・ストラクチャ"の基準は次のとおりです。タグの相対位置を簡単に検索し、その内容にアクセスしたいとします。たとえば、 "bodyの3番目のh3タグの後の2番目のイメージ・タグのイメージ"ヘッダー "。どのようなJava APIデータ構造がHTMLツリーに適していますか?

私が探しているタグのタグの最初のレベルを検索し、そのタグに関連付けられているブランチに移動することを期待しています。それがこの質問が探している構造ですが、HTML文書の相対的な場所を見つける良い方法があれば、説明してください。

それは質問です。より一般的には、ツリーデータ構造を表すことができるAPIを介してどのような種類のJava構造が利用可能ですか?

+0

基本的に 'LinkedList' –

+1

マップのマップはツリー構造を表すことができます。私は具体的には 'LinkedHashMap'を使用します。これは、あなたがエントリを反復処理することによって何かの後に何かを見つけることを可能にする挿入順序を維持するからです。 'map.get(" ").get(" ").get(" Text ")'のようなトラバースは可能ですが、それは素晴らしいものから遠いです。 – <span class="text-secondary"> <small> <a rel="noopener" target="_blank" href="https://stackoverflow.com/users/995891/">zapl</a></span> <span></span> </small> </span> </p> </div> </div> </div> </div> </div> </article> </div> <div class="answer-title"> <span class="text-logo margin-top-sm">A</span> <h2 class="title h4">答えて</h2> </div> <div class="item-description text-md markdown-body margin-bottom-40 voidso"> <article class="board-top-1 padding-top-10"> <div class="post-col vote-info"> <span class="count">1<i class="fa fa-thumbs-up"></i></span> <i class="fa fa-check fa-2x"></i> </div> <div class="post-offset"> <div class="answer fmt"> <p><a href="https://jsoup.org/" rel="nofollow">Jsoup</a>のようなHTMLパーサーを使用するだけでホイールを再作成しないでください。<a href="https://jsoup.org/apidocs/org/jsoup/nodes/Element.html#select-java.lang.String-" rel="nofollow"><code class="prettyprint-override">Element#select(cssQuery)</code></a>を使用して<code class="prettyprint-override">CSS selector</code>にタグを付けることができます。</p> <pre><code class="prettyprint-override">Document doc = Jsoup.parse(file, encoding); Elements elements = doc.select(cssQuery); </code></pre> </div> <div class="post-info"> <div class="post-meta row"> <p class="text-secondary col-lg-6"> <span class="source"> <a rel="noopener" target="_blank" href="https://stackoverflow.com/q/37577650">出典</a> </span> </p> <p class="text-secondary col-lg-6"> <span class="float-right date"> <span>2016-06-01 19:54:38</span> </p> <p class="col-12"></p> <p class="col-12"></p></div> </div> </div> </article> <div> <script async src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-6208739752673518" data-ad-slot="1038284119" data-ad-format="auto" data-full-width-responsive="true"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> </div> <div class="clearfix"> </div> <div class="relative-box"> <div class="relative">関連する問題</div> <ul class="relative_list"> <li> 1. <a href="http://ja.uwenku.com/question/p-vmgluarz-cz.html" target="_blank" title="どのようなデータベースが非構造化データに適していますか"> どのようなデータベースが非構造化データに適していますか </a> </li> <li> 2. <a href="http://ja.uwenku.com/question/p-fhftqwbr-e.html" target="_blank" title="マップのツリーの最適なデータ構造"> マップのツリーの最適なデータ構造 </a> </li> <li> 3. <a href="http://ja.uwenku.com/question/p-woxzwegr-co.html" target="_blank" title="ツリー構造は、どのように私は、ツリー構造を持っている"> ツリー構造は、どのように私は、ツリー構造を持っている </a> </li> <li> 4. <a href="http://ja.uwenku.com/question/p-ergqtqil-bx.html" target="_blank" title="このアソシエーションにはどのような構造が適していますか?"> このアソシエーションにはどのような構造が適していますか? </a> </li> <li> 5. <a href="http://ja.uwenku.com/question/p-egsetzli-ka.html" target="_blank" title="いくつかの要素にはどのようなデータ構造が適していますか?"> いくつかの要素にはどのようなデータ構造が適していますか? </a> </li> <li> 6. <a href="http://ja.uwenku.com/question/p-vvaelzuk-oq.html" target="_blank" title="Javaツリーのデータ構造の実装"> Javaツリーのデータ構造の実装 </a> </li> <li> 7. <a href="http://ja.uwenku.com/question/p-eewuvfba-co.html" target="_blank" title="ツリーのデータ構造"> ツリーのデータ構造 </a> </li> <li> 8. <a href="http://ja.uwenku.com/question/p-dvoaxnns-mr.html" target="_blank" title="Javaの適切なコンテナ/データ構造体"> Javaの適切なコンテナ/データ構造体 </a> </li> <li> 9. <a href="http://ja.uwenku.com/question/p-xnzoyeev-dk.html" target="_blank" title="ツリーのデータ構造とデータ"> ツリーのデータ構造とデータ </a> </li> <li> 10. <a href="http://ja.uwenku.com/question/p-uveedrre-ev.html" target="_blank" title="どのCamel構造が変形に適していますか?"> どのCamel構造が変形に適していますか? </a> </li> <div> <script async src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block; text-align:center;" data-ad-layout="in-article" data-ad-format="fluid" data-ad-client="ca-pub-6208739752673518" data-ad-slot="4606349252"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <li> 11. <a href="http://ja.uwenku.com/question/p-xndiswlm-pa.html" target="_blank" title="JAVAのSWING - カスタム構造のようなツリーの設計"> JAVAのSWING - カスタム構造のようなツリーの設計 </a> </li> <li> 12. <a href="http://ja.uwenku.com/question/p-ahqfztui-cq.html" target="_blank" title="キャッシュ構造のようなInfinispanツリー"> キャッシュ構造のようなInfinispanツリー </a> </li> <li> 13. <a href="http://ja.uwenku.com/question/p-berbjevr-oe.html" target="_blank" title="データ構造のようなツリーのすべてのパスをトレースするには?"> データ構造のようなツリーのすべてのパスをトレースするには? </a> </li> <li> 14. <a href="http://ja.uwenku.com/question/p-fvgrgxru-ce.html" target="_blank" title="iPhoneツリーのデータ構造"> iPhoneツリーのデータ構造 </a> </li> <li> 15. <a href="http://ja.uwenku.com/question/p-xsxdpkbu-ot.html" target="_blank" title="ツリー構造のデータを扱うインメモリデータベース"> ツリー構造のデータを扱うインメモリデータベース </a> </li> <li> 16. <a href="http://ja.uwenku.com/question/p-dfcypejf-cm.html" target="_blank" title="PostgreSQLツリーのデータ構造"> PostgreSQLツリーのデータ構造 </a> </li> <li> 17. <a href="http://ja.uwenku.com/question/p-yvefdhbg-mz.html" target="_blank" title="ツリー(データ構造)のドキュメントストアデータモデリング"> ツリー(データ構造)のドキュメントストアデータモデリング </a> </li> <li> 18. <a href="http://ja.uwenku.com/question/p-elpnyrlf-gq.html" target="_blank" title="セレンideデータ構造ツリーexpand"> セレンideデータ構造ツリーexpand </a> </li> <li> 19. <a href="http://ja.uwenku.com/question/p-huowdddn-c.html" target="_blank" title="基本的な配列[] Javaでのツリーのデータ構造"> 基本的な配列[] Javaでのツリーのデータ構造 </a> </li> <li> 20. <a href="http://ja.uwenku.com/question/p-nbdpmuom-ex.html" target="_blank" title="mongodb:階層ツリー構造を格納していますか?"> mongodb:階層ツリー構造を格納していますか? </a> </li> <li> 21. <a href="http://ja.uwenku.com/question/p-amisrtgx-dh.html" target="_blank" title="C++ STLには他にどのようなデータ構造がありますか?"> C++ STLには他にどのようなデータ構造がありますか? </a> </li> <li> 22. <a href="http://ja.uwenku.com/question/p-wxzodmlr-ch.html" target="_blank" title="java.util.Stack適切なデータ構造ですか?"> java.util.Stack適切なデータ構造ですか? </a> </li> <li> 23. <a href="http://ja.uwenku.com/question/p-hyjlmrto-y.html" target="_blank" title="オープンソースグラフ(データ構造のように)データベースエンジンを探しています"> オープンソースグラフ(データ構造のように)データベースエンジンを探しています </a> </li> <li> 24. <a href="http://ja.uwenku.com/question/p-ffdqjrus-g.html" target="_blank" title="これにはどのデータ構造が最適でしょうか?"> これにはどのデータ構造が最適でしょうか? </a> </li> <li> 25. <a href="http://ja.uwenku.com/question/p-khmqyjvj-es.html" target="_blank" title="データをどのように構造化できますか?"> データをどのように構造化できますか? </a> </li> <li> 26. <a href="http://ja.uwenku.com/question/p-ogsmcorj-kt.html" target="_blank" title="マルチレベルJSONツリー構造のHTMLをレンダリング"> マルチレベルJSONツリー構造のHTMLをレンダリング </a> </li> <li> 27. <a href="http://ja.uwenku.com/question/p-ciikovjh-nn.html" target="_blank" title="は、どのように階層ツリー構造"> は、どのように階層ツリー構造 </a> </li> <li> 28. <a href="http://ja.uwenku.com/question/p-fdafphgd-dx.html" target="_blank" title="xsd:QNameにはどのような種類のデータが適していますか?"> xsd:QNameにはどのような種類のデータが適していますか? </a> </li> <li> 29. <a href="http://ja.uwenku.com/question/p-xzshdsah-ms.html" target="_blank" title="どのような種類のデータ構造ですか?"> どのような種類のデータ構造ですか? </a> </li> <li> 30. <a href="http://ja.uwenku.com/question/p-sdkpwuhd-oo.html" target="_blank" title="SparkのDataFrameはどのようなデータ構造ですか?"> SparkのDataFrameはどのようなデータ構造ですか? </a> </li> </ul> </div> <div> <script async src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block" data-ad-format="autorelaxed" data-ad-client="ca-pub-6208739752673518" data-ad-slot="1575177025"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <div class="padding-top-10"></div> </div> </div> <script type="text/javascript" src="http://img.uwenku.com/uwenku/script/side.js?t=1644592048742"></script> <script type="text/javascript" src="http://img.uwenku.com/uwenku/plugin/highlight/highlight.pack.js"></script> <link href="http://img.uwenku.com/uwenku/plugin/highlight/styles/docco.css" media="screen" rel="stylesheet" type="text/css" /> <script type="text/javascript"> $('pre').each(function(i, e) { hljs.highlightBlock(e, "<span class='indent'> </span>", false) }); </script> <div class="col-lg-3 col-md-4 col-sm-5"> <div id="rightTop"> <div class="row"> <script async src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-6208739752673518" data-ad-slot="5415218910" data-ad-format="auto" data-full-width-responsive="true"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <div class="row sidebar panel panel-default"> <div class="panel-heading font-bold"> 最新の質問 </div> <div class="m-b-sm m-t-sm clearfix"> <ul class="side_article_list"> <li class="side_article_list_item"> 1. <a href="http://ja.uwenku.com/question/p-prmddxru-kc.html" target="_blank" title="Ionic-3 ImageTransferをNodeJsサーバーにネイティブでアップロードする"> Ionic-3 ImageTransferをNodeJsサーバーにネイティブでアップロードする </a> </li> <li class="side_article_list_item"> 2. <a href="http://ja.uwenku.com/question/p-yhahyrpp-hw.html" target="_blank" title="既存のWebページから1つのWebページを開き、APIレベル> 23のWebビューで表示しようとするとどうなりますか?"> 既存のWebページから1つのWebページを開き、APIレベル> 23のWebビューで表示しようとするとどうなりますか? </a> </li> <li class="side_article_list_item"> 3. <a href="http://ja.uwenku.com/question/p-fmmiiibr-hr.html" target="_blank" title="ログインしていないユーザーのページ(投稿)のビューとして値を保存していますか?"> ログインしていないユーザーのページ(投稿)のビューとして値を保存していますか? </a> </li> <li class="side_article_list_item"> 4. <a href="http://ja.uwenku.com/question/p-apyccmgn-ht.html" target="_blank" title="VSコード設定を維持するのは面倒です - ツール>オプションダイアログボックスを作成するには何が必要ですか? VSコードの設定を維持"> VSコード設定を維持するのは面倒です - ツール>オプションダイアログボックスを作成するには何が必要ですか? VSコードの設定を維持 </a> </li> <li class="side_article_list_item"> 5. <a href="http://ja.uwenku.com/question/p-zjyudngz-hq.html" target="_blank" title="WAMPのリモートアクセスは、私はつまり、ローカルネットワーク上のリモートデバイスからのWordPressのウェブサイトにアクセスすると、URL"> WAMPのリモートアクセスは、私はつまり、ローカルネットワーク上のリモートデバイスからのWordPressのウェブサイトにアクセスすると、URL </a> </li> <li class="side_article_list_item"> 6. <a href="http://ja.uwenku.com/question/p-oehbcwcy-hc.html" target="_blank" title="チェックボックスが有効な場合、jQueryは他の行の入力を無効にします"> チェックボックスが有効な場合、jQueryは他の行の入力を無効にします </a> </li> <li class="side_article_list_item"> 7. <a href="http://ja.uwenku.com/question/p-mquwpokt-hg.html" target="_blank" title="私は自分のサイトにジキル理想のイメージスライダープラグインを追加しようとする私のサイト"> 私は自分のサイトにジキル理想のイメージスライダープラグインを追加しようとする私のサイト </a> </li> <li class="side_article_list_item"> 8. <a href="http://ja.uwenku.com/question/p-cnlmuqmz-go.html" target="_blank" title="複数のgojsonschemasを後で使用するためにロードする"> 複数のgojsonschemasを後で使用するためにロードする </a> </li> </ul> </div> </div> </div> <p class="article-nav-bar"></p> <div class="row sidebar article-nav"> <div class="row box_white visible-sm visible-md visible-lg margin-zero"> <div class="top"> <h3 class="title"><i class="glyphicon glyphicon-th-list"></i> 関連する問題</h3> </div> <div class="article-relative-content"> <ul class="side_article_list"> <li class="side_article_list_item"> 1. <a href="http://ja.uwenku.com/question/p-vmgluarz-cz.html" target="_blank" title="どのようなデータベースが非構造化データに適していますか"> どのようなデータベースが非構造化データに適していますか </a> </li> <li class="side_article_list_item"> 2. <a href="http://ja.uwenku.com/question/p-fhftqwbr-e.html" target="_blank" title="マップのツリーの最適なデータ構造"> マップのツリーの最適なデータ構造 </a> </li> <li class="side_article_list_item"> 3. <a href="http://ja.uwenku.com/question/p-woxzwegr-co.html" target="_blank" title="ツリー構造は、どのように私は、ツリー構造を持っている"> ツリー構造は、どのように私は、ツリー構造を持っている </a> </li> <li class="side_article_list_item"> 4. <a href="http://ja.uwenku.com/question/p-ergqtqil-bx.html" target="_blank" title="このアソシエーションにはどのような構造が適していますか?"> このアソシエーションにはどのような構造が適していますか? </a> </li> <li class="side_article_list_item"> 5. <a href="http://ja.uwenku.com/question/p-egsetzli-ka.html" target="_blank" title="いくつかの要素にはどのようなデータ構造が適していますか?"> いくつかの要素にはどのようなデータ構造が適していますか? </a> </li> <li class="side_article_list_item"> 6. <a href="http://ja.uwenku.com/question/p-vvaelzuk-oq.html" target="_blank" title="Javaツリーのデータ構造の実装"> Javaツリーのデータ構造の実装 </a> </li> <li class="side_article_list_item"> 7. <a href="http://ja.uwenku.com/question/p-eewuvfba-co.html" target="_blank" title="ツリーのデータ構造"> ツリーのデータ構造 </a> </li> <li class="side_article_list_item"> 8. <a href="http://ja.uwenku.com/question/p-dvoaxnns-mr.html" target="_blank" title="Javaの適切なコンテナ/データ構造体"> Javaの適切なコンテナ/データ構造体 </a> </li> <li class="side_article_list_item"> 9. <a href="http://ja.uwenku.com/question/p-xnzoyeev-dk.html" target="_blank" title="ツリーのデータ構造とデータ"> ツリーのデータ構造とデータ </a> </li> <li class="side_article_list_item"> 10. <a href="http://ja.uwenku.com/question/p-uveedrre-ev.html" target="_blank" title="どのCamel構造が変形に適していますか?"> どのCamel構造が変形に適していますか? </a> </li> </ul> </div> </div> </div> </div> </div> </div> </div><!-- wrap end--> <!-- footer --> <footer id="footer"> <div class="bg-simple lt"> <div class="container"> <div class="row padder-v m-t"> <div class="col-xs-8"> <ul class="list-inline"> <li><a href="http://ja.uwenku.com/contact">お問い合わせ</a></li> <li>© 2020 JA.UWENKU.COM</li> <li><a target="_blank" href="https://beian.miit.gov.cn/">沪ICP备13005482号-4</a></li> <li><script type="text/javascript" src="https://v1.cnzz.com/z_stat.php?id=1280101193&web_id=1280101193"></script></li> <li><a href="http://www.uwenku.com/" target="_blank" title="优文库">简体中文</a></li> <li><a href="http://hk.uwenku.com/" target="_blank" title="優文庫">繁體中文</a></li> <li><a href="http://ru.uwenku.com/" target="_blank" title="поле вопросов и ответов">Русский</a></li> <li><a href="http://de.uwenku.com/" target="_blank" title="Frage - und - antwort - Park">Deutsch</a></li> <li><a href="http://es.uwenku.com/" target="_blank" title="Preguntas y respuestas">Español</a></li> <li><a href="http://hi.uwenku.com/" target="_blank" title="कार्यक्रम प्रश्न और उत्तर पार्क">हिन्दी</a></li> <li><a href="http://it.uwenku.com/" target="_blank" title="IL Programma di chiedere Park">Italiano</a></li> <li><a href="http://ja.uwenku.com/" target="_blank" title="プログラム問答園区">日本語</a></li> <li><a href="http://ko.uwenku.com/" target="_blank" title="프로그램 문답 단지">한국어</a></li> <li><a href="http://pl.uwenku.com/" target="_blank" title="program o park">Polski</a></li> <li><a href="http://tr.uwenku.com/" target="_blank" title="Program soru ve cevap parkı">Türkçe</a></li> <li><a href="http://vi.uwenku.com/" target="_blank" title="Đáp ứng viên">Tiếng Việt</a></li> <li><a href="http://fr.uwenku.com/" target="_blank" title="Programme interrogation Park">Française</a></li> </ul> </div> </div> </div> </div> </div> </footer> <!-- / footer --> <script> var _hmt = _hmt || []; (function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?f78a970f17b19a79fc477a3378096f29"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s); })(); </script> </body> </html>