私はプロジェクトに取り組んでいます。私はページのレイアウトに興味があり、テキストには興味がありません。私は現在、テキストレベルですべての要素を取り除くことに問題があります。例えば:Jsoupでテキストレベルのすべての要素を削除するには?
私はテキストレベルで要素 UL、李、pとH3を取り除くが、これはページのレイアウトの一部であるとして、DIVおよびメニュー項目のリストを維持したい<div>
<ul>
<li>some menu item</li>
<li>some menu item</li>
<li>some menu item</li>
</ul>
</div>
<div>
<h3>Tile of some text</h3>
<p></p>
<p>some text</p>
<ul>
<li>some other text</li>
<li>some other text</li>
<li>some other text</li>
</ul>
</div>
。 Jsoupでこれをどうやってやるの?
私はdocument.select()でこれを行い、その要素を.remove()しようとしましたが、このような非標準クエリに対してはselect関数は作成されていません。
EDIT:私が取得したい最終的な結果は次のとおりです。
<div>
<ul>
<li>some menu item</li>
<li>some menu item</li>
<li>some menu item</li>
</ul>
</div>
<div>
</div>
あなたは、ULタグがそれらのテキストとタグと同じレベルにあるとき、それはリストを削除見ることができるように。 ulタグは、ページ上のテキストの一部であり、ページのレイアウトとは関係ありません。メニュー項目があるulタグは、そこにメニューがあり、3つの異なる項目があることを定義するので、ページにとって重要です。
あなたはHTMLがあなたの変更後、のようになります方法の例をお願いできますか? – CanB