プレーンテキストを含むサーバーからかなり大きなログファイルがあります。サーバーはすべてのことをログに記録し、時には解析に興味のあるxmlタグを出力します。あなたの例を与えるために:JavaとSAXを使用して、時折XMLタグでプレーンテキストファイルを解析する方法は?
-----------log file-------------
bla bla bla random text
<logMessage>test Message</logMessage>
some more random server output
<logMessage>some other message</logMessage>
bla bla bla
end of log file
私はちょうど< LogMessageに>タグからデータを抽出し、残りを無視したいです。私はJavaとSAXを使用していますが、SAXパーサーはファイルの内容が厳密にXML形式であると予想しており、このタイプのファイルは処理できません。 SAXに、ファイルが整形式のXMLではないという事実を無視/無視するように指示する方法はありますか? 代替手段はありますか?ファイルを1行ずつ読み込み、タグを探しますか? :(
あなたが唯一の特定のblablablahが必要な場合は、小さな猫をボトルに詰め取得することができますし、 – Alfabravo