0
私は2つのファイルを開き、その内容をセット(set1とset2)に保存し、これらのセットのペアワイズ比較の結果を出力ファイルに保存するコードを持っています。どちらのファイルも本当に大きく(それぞれ100Kを超える)、このコードは出力に長時間を要しています(10時間以上)。ゆっくりとペアごとの比較
パフォーマンスを最適化する手段はありますか?
def matches2smiles():
with open('file1.txt') as f:
set1 = {a.rstrip('\n') for a in f}
with open('file2.txt') as g:
set2 = {b.replace('\n', '') for b in g}
with open('output.txt', 'w') as h:
r = [
h.write(b + '\n')
for a in set1
for b in set2
if a in b
]
matches2smiles()