2011-06-29 12 views
0

私はファイル.txtを読んでいますが、重複する単語を削除したいのですが。私は、ファイルから.txtから単語を削除する方法

+0

正確に何をしますか?行内に2回書き込まれた単語を削除しますか?あなたがそれをやっているなら、今のように言葉の順序を取り除くことは、あまり役に立たないでしょう。 –

+0

あなたは単語を索引付けして結果を新しいファイルに書き換えたいのですか?単語にインデックスを付ける場合は、 'OrderedSet()'を使用します。 – Lynch

+1

入力ファイルの例とその出力がどのように表示されるかを示すことができれば助かります。 –

答えて

2
次の場所からコンテンツを削除することはできません

残りのコンテンツを下にシフトさせます。追加、切り詰め、上書きしかできません。

ファイルをメモリに読み込んでメモリで処理し、ディスクに書き戻すことをお勧めします。

0

使用正規表現の単語を削除する方法を知らない

c = collections.Counter() 
with open('DatoSO.txt', 'rt') as f: 
     for line in f: 
      c.update(line.split()) 


for palabra,count in c.most_common(): 
    if count > 1 : 
     with open('DatoSO.txt', 'rt') as f: 
      Here REMOVE 

:再使用しないでください

import re 

... 

f = re.sub(r'\w+\s?','',f) 
0

line.remove(string) 
関連する問題