XMLデータのチャンクを持つドキュメントがありますが、各チャンクの中間にプレーンテキストがあります。どのようにしてXMLデータだけを抽出するのですか?テキストファイルをXMLに分割する
すなわち
blah blah blah
===: text text text :===
<?xml version="1.0" ?>
<Data>
<Line>information</Line>
<Line2>more information</Line2>
</Data>
===: text text text :===
blah blah blah
blah blah blah
===: text text text :===
<?xml version="1.0" ?>
<Data>
<Line>2nd information</Line>
<Line2>more information</Line2>
</Data>
===: text text text :===
blah blah blah
withingテキスト===:===常に異なるものになりますが、含める必要はありません。
がはるかに具体的なものを '===程度としてみてくださいインデントを維持したい場合:テキストテキストテキスト:==='ライン、彼らはまったく同じでリテラルと常に存在しています方法? –
それは毎回異なるでしょう、セパレータはタイムスタンプと他の情報の束を持っています – frebbie
まだ少し情報が不足しています。ファイルはXMLで始めることができますか、最初のxmlの前に常に '===:...:==='行がありますか? –