を発生することがありますパターンに基づいて、小さなファイルに大きなファイルを分割しましたcolumn3。は、私は以下の内容で、この大規模なファイルを持ってランダムにPythonの
はFile1:Ramesh.txt
column1 column2 column3
345 367 Ramesh
456 469 Ramesh
300 301 Ramesh
File2の:Naresh.txt
column1 column2 column3
298 390 Naresh
FILE3:Suresh.txt
Column1 column2 column3
123 125 suresh
394 305 suresh
と同様に、このような。 は、私は次のPythonコードを書き、それが働いた:
def split_file(file1):
source=open(file1)
l=[]
header=0
header_line=""
file_count=0
for line in source:
line=line.rstrip()
a=line.split()
if header==0:
header_line=line
header+=1
else:
if a[-1] not in l:
l.append(a[-1])
file_count+=1
if file_count>1:
dest.close()
else:
pass
dest=open(a[-1],'a')
dest.write(header_line+"\n"+line+"\n")
else:
dest.write(line+"\n")
source.close()
dest.close()
は今、私のクエリは、私がCOLUMN3がソートされていない場合でも動作するようにこれらのコードを変更する方法です。例:
Column1 column2 column3
345 367 Ramesh
123 125 Suresh
456 469 Ramesh
298 390 Naresh
300 301 Ramesh
394 305 Suresh
出力ファイルを処理するための値としてランダム変数をキーとして、column3に名前を付けて生成しますか?スクリプトがキーに出会うたびにこの辞書を使用してファイルを開きますか?どんな提案も感謝します。
私は、UnixベースのOS用の短いコマンドラインソリューションを提案します – RomanPerekhrest