2011-12-23 22 views
1

xmlファイルに、XPathを使用して解析しようとしている次の行があります。 XMLファイル自体は、PDFtoHTMLコンバータを使用してPDF文書を変換することによって得られました。ご覧のとおり、ここに
の終了タグは追加されていません。だから私は、タグのtextValueをキャプチャしようとしてXPathを実行しようとすると、それは私にエラーが表示されます
は、終了タグが続く必要があります。 XPathでこれをどのように克服できますか? Hovewer、ブラウザでファイルを開くと、すべてがブラウザで正常に表示されます。終了タグを無視するXPath

<DIV style="position:absolute;top:222;left:143"> 
    <nobr> 
    <span class="ft8">Dear Mr. AMIT KUMAR, 
     <br>We are happy to enclose<br>31st March, 2011 
    </span> 
    </nobr> 
</DIV> 

おかげ アビシェークSあなたが投稿した何

答えて

4

はXMLではありません。これをXPathで克服することはできません。

HTMLを生成したら、HTML Tidyを使用してXMLに変換したり、PDFを整形式のXMLに変換するコンバータを使用したりできます。

+0

ポールが正しいです。 HTMLとXMLを混同することはできません。 HTMLのタグには**
**のような終了タグは必要ありませんが、XMLでは開かれたタグごとに終了タグを付ける必要があります –

+0

HTMLCleanerはxmlとしてHTMLコンテンツにアクセスするのに非常に便利です:http:// htmlcleaner.sourceforge.net) – Edd

+0

Paulに感謝して、今すぐユーティリティをチェックしてください。また、開始タグがアルファベットの大文字と小文字の違いがある and the closing tag isである場合、ユーティリティは大文字と小文字を同じにしますか?ご存知ですか? –

関連する問題