過去の単純なバッチファイルを使用して、単一のtxtファイル内の文字列を検索し、複数のtxtファイルをマージしましたが、これは少し複雑です。開始。ここでファイル名と複数の文字列を返すバッチファイル
は私がやろうとしています何のブレークダウンです:
は300+のtxtファイル
で一つのフォルダは、各txtファイル」は、文字列の出現の少なくとも一方が、多分数百を持っている持っていますdocumentID: "、それに続いて6つのチャーターがあります。
txtファイルやCSV、TXTファイルのファイル名を持つ、と毎回のための文字列「文書IDが」したいtxtファイルに発見された - 6次の文字が
例:
jsmith.txt:
<type>not needed</type>
<version>1.0</version>
not needed,not needed, not needed, documentID:NEED01, not needed
not needed,not needed, not needed, documentID:NEED02, not needed
jdoe.txt
<type>not needed</type>
<version>1.0</version>
not needed,not needed, not needed, documentID:NEED03, not needed
所望の出力:
new.txt
jsmith, NEED01, NEED02
jdoe, NEED03
が、これはハイブリッドXMLファイルのいくつかの種類ですか?各文書IDはそれ自身の行にありますか?それは常に4番目のコンマで区切られたフィールドにありますか? – Squashman
はいこれはxmlファイルです(ただし、出力が必要なため、txtファイルにする必要があります)。必要なコンテンツは必ずしも4番目のフィールドにあるとは限らず、時には多くのフィールドや多くのフィールドがあります。 – PaperClip