2017-11-22 16 views
0

xmlファイルを読み込むためにStAXパーサを使用しています。 XMLファイルの中にはフォーマットが正しくないものもあります。つまり、終了タグが欠落していることがあります。 例: <tag1> <tag2> </tag2> <tag3> <tag4> </tag4> </tag1> この場合、終了タグが見つからない場合、StAXパーサーは前方に移動しません。それは「tag3」までしか読んでいない。終了タグが見つからない場合、StAXパーサーが前方に移動しない

解決方法を教えてください。ファイル形式に関係なくファイル全体を解析できる他の解析方法を教えてください。

+0

xmlを修正してxmlパーサに入力する前に整形してください...または独自の構文解析手順を書いてください...これは簡単な方法ではありません... –

答えて

1

入力が「正しくフォーマットされていません」というXMLではなく、XMLではありません。 STaXやDOMに関係なく、XMLパーサーが正しく動作するためには、有効なXMLを提供する必要があります。

+0

このようなファイルを読むためのフレームワークはありますか?私の主な目的は、XMLファイルのタグを読み取って、フォーマットに関係なくコンテンツを取得することです。タグが見つかった場合は、そのタグを検索する必要があります。 – Rekha

+0

ruby​​ XMLから適切なXMLを作成しようとするvalidator.nuやHTML Tidyなどのツールがあります。もちろん、最初はゴミXMLの作成を避ける方が良いでしょう。 –

+0

XMLファイルを作成することは私の手にはありません。他の人がファイルを作成して読み込む必要があります。だから私はそのようなツールを探しているのです。 – Rekha

関連する問題