属性:これはHtmlパーサーにとって適切なシナリオではありませんか?
<p class="<sometag attr="something"></sometag>">
<a href="<someothertag></someothertag">Link</a>
</p>
は、私がコンテンツを解析するHtmlAgilityPackを使用してみましたが、あなたがHTMLDocumentのに上記のコードをロードし、OuterHtml
出力:
<p class="<sometag attr=" something"="">">
<a href="<someothertag></someothertag">Link</a>
</p>
p
タグが不正な形式になり、それが本当に属性内のテキストですが、a
タグの属性href
内部someothertag
が(ノードとして認識されていない、私はそれがRECOになりたいですタグとしてgnized)。
このように悪いHTMLを解析するのに役立つものがありますか?
本当にそのようなものを解析することはできません。少なくともあなたが望むように常に働く方法ではありません。なぜこのような恐ろしいものを解析する必要がありますか? – svick
私は誰がそのようなことを生み出すのかを知りたいのですか? – ChaosPandion
これは私が対処する必要があるカスタムテンプレートの構文です。 – Omar