2011-11-07 3 views
0

私は文字列に存在しないことを確認するために必要なキーワードのリストを持っています。 この文字列は、パッチなどのsvnまたはgitリポジトリ構文を含むプレーンテキストまたはプレーンテキストのいずれかです。 python/django環境でどのくらい正確にこの検索を実装しますか?正規表現、ループ、grep?私は理想的には、それが発生した行をユーザーに表示できるようにしたいと思っています。ここでpython djangoはファイルのキーワードリストを分析します

+0

あなたのテキストファイルが構成されている方法のサンプルを提供することができますか? – Ole

+0

これは基本的にsvnタグ付きのC++コードなので、ヘッダーとフッターには++++++++++++ – user391986

答えて

1

あなたは以下のとおりです。

import re 

BAD_WORDS = ["spam", "ham"] 
BAD_WORDS_RE = re.compile(r"\b(%s)\b" % "|".join(BAD_WORDS)) 

for i, line in enumerate(open("file.txt").readlines()): 
    words = set(BAD_WORDS_RE.findall(line)) 
    if words: 
     print "Found the following words on line %i: %s" % (i + 1, ", ".join(words)) 
     print line 
1
txt = open('the_file.txt', 'r').read() 
for keyword in ['foo', 'bar']: 
    if keyword in txt: 
     # Do something for when the keyword is found 
     print 'Matched keyword %s' % keyword 
関連する問題