私はこのようなHTMLの構造を解析する必要があります。シンプルなHTML Domはサポートしていますか?解析していますか?
<div class='container>
<div class='inner-div'>
<span class='text'>...</span>
<div class='author'>
<span data-author='Alpha'>...</span>
</div>
<div class='summary'>
<span data-summary='Exclusive'>Text 1</span>
</div>
</div>
<div class='inner-div'>
<span class='text'>...</span>
<div class='author'>
<span data-author='Beta'>...</span>
</div>
<div class='summary'>
<span data-summary='Non-Exclusive'>Text 2</span>
</div>
</div>
<div class='inner-div'>
<span class='text'>...</span>
<div class='author'>
<span data-author='Gamma'>...</span>
</div>
<div class='summary'>
<span data-summary='Exclusive'>Text 3</span>
</div>
</div>
<div class='inner-div'>
<span class='text'>...</span>
<div class='author'>
<span data-author='Delta'>...</span>
</div>
<div class='summary'>
<span data-summary='Non-Exclusive'>Text 4</span>
</div>
</div>
...
<div class='inner-div'>
<span class='text'>...</span>
<div class='author'>
<span data-author='Zeta'>...</span>
</div>
<div class='summary'>
<span data-summary='Exclusive'>Text 5</span>
</div>
</div>
</div>
私は著者が「アルファ」ではありません最初の「独占」の要約を取得したいです。上記の例では、 'Text 3'になります。どのように私は単純なHTML DOMまたはXML DOMを使用してこれを解析することができますか?
追加:PHP Simple HTML Domライブラリを使用してHTMLを解析しようとしています。私はjQueryでそれを解析する方法を知っていますが、シンプルなHTML Domライブラリは、(:has)と同等のものをサポートしていないようです。
感謝を。それをテストし、シンプルな解析のためにSHDほど速くなることを願っています。これを受け入れられた回答とします。誰かがsimple_html_domでのみこれを達成したい場合に備えて、私自身の答えを利用可能にしておきます。 – Gaurav
多くのセレクタでAHDが壊れているようです。今のところSHDに固執する必要があります。 – Gaurav
実際のCSSセレクタで壊れていますか?私はそうは思わないが、もしあなたがそうしたら、問題を開くべきだ。 – pguardiario