多くのテキストファイルを含むフォルダがありますが、ファイルの一部は他のファイルと同じ内容です。一意のコンテンツだけをマージし、重複を無視するにはどうすればよいですか? 重複する行を削除しません。複数のテキストファイルのコンテンツをPythonで一意にマージするにはどうすればよいですか?
テキストファイル1:
Line1
Line1
Line3
テキストファイル2:
Line1
Line1
Line3
テキストファイル3:
text1
Line2
text3
結果:
Line1
Line1
Line3
text1
Line2
text3
次のように私のファイル
私はこれを試してみましたが、これは一つのファイルにそれらのすべてを兼ね備え:私はすべてのファイルを読み込み、単一のテキストファイル内の唯一のユニークなコンテンツを書くことができますどのように
import glob
txt_files = glob.glob('*.log')
with open('merged_files.txt','w') as merged_files:
for f in txt_files:
for line in open(f,'r'):
merged_files.write(line)
?
私は何千ものテキストファイルをKB単位で持っています。私が言ったように私はファイル自体に重複した行を削除したくない。テキストfile1の内容が同じで、この場合はwriteText file1だけなので、text2を無視したいだけです。 – Alsphere