終了タグを無視するXPath

xmlファイルに、XPathを使用して解析しようとしている次の行があります。 XMLファイル自体は、PDFtoHTMLコンバータを使用してPDF文書を変換することによって得られました。ご覧のとおり、ここに
の終了タグは追加されていません。だから私は、タグのtextValueをキャプチャしようとしてXPathを実行しようとすると、それは私にエラーが表示されます
は、終了タグが続く必要があります。 XPathでこれをどのように克服できますか？ Hovewer、ブラウザでファイルを開くと、すべてがブラウザで正常に表示されます。終了タグを無視するXPath

<DIV style="position:absolute;top:222;left:143"> 
    <nobr> 
    <span class="ft8">Dear Mr. AMIT KUMAR, 
     <br>We are happy to enclose<br>31st March, 2011 
    </span> 
    </nobr> 
</DIV>

おかげアビシェークSあなたが投稿した何

出典

2011-12-23 London guy

はXMLではありません。これをXPathで克服することはできません。

HTMLを生成したら、HTML Tidyを使用してXMLに変換したり、PDFを整形式のXMLに変換するコンバータを使用したりできます。

出典

2011-12-23 10:07:40

ポールが正しいです。 HTMLとXMLを混同することはできません。 HTMLのタグには**
**のような終了タグは必要ありませんが、XMLでは開かれたタグごとに終了タグを付ける必要があります –

HTMLCleanerはxmlとしてHTMLコンテンツにアクセスするのに非常に便利です：http：// htmlcleaner.sourceforge.net） – Edd

Paulに感謝して、今すぐユーティリティをチェックしてください。また、開始タグがアルファベットの大文字と小文字の違いがある and the closing tag isである場合、ユーティリティは大文字と小文字を同じにしますか？ご存知ですか？ –

終了タグを無視するXPath

答えて

関連する問題