おはよう。私はPythonには新しく、別のhtmlファイルにある正確なキーワード(長い文字列でも可)をテキストファイルから検索するコードを探しています。例:keyword.txtおよびdata.html現在のところ、正確な文の一致ではなく、最初の単語と一致するだけです。Python:2つのファイルから正確な文章を見つけてください
マイキーワードファイルが含まれています
Hello welcome
Hello welcome to this page
Hello world
私のデータファイルが含まれています。それは返す必要があり、この条件のため
Hello
hello good day
:マッチしないが、現在、それは戻っています「が見つかりマッチ」。
また、すべてのキーワードがhtmlページに対して1行ずつ検索されるようにする方法。
本当に感謝します。前もって感謝します。
私の現在のコード:re.findall(r'\w+', open(keyfile , "r").readline()))
から
import re
keyfile = 'keyword.txt'
testfile = 'data.txt'
keys = set(key.lower() for key in
re.findall(r'\w+', open(keyfile , "r").readline()))
with open(testfile) as f:
for line in f:
words = set(word.lower() for word in re.findall(r'\w+', line))
if keys & words:
print "match found"
@Kalaireas正しい場合はコードのインデントを確認してください。 – MYGz
'if keys&words:'は 'keys'と' words'の共通部分を見つけ、それが空でないかどうかを調べます。あなたのキーファイルの全行の内容を一致させたいのですか? –
@PatrickHaugh、はい、キーファイルの内容(行単位)とデータファイルの完全一致を探したいと思います。たとえば、行のいずれかがdata.htmlファイルと一致する場合は、「一致」を出力する必要があります。 – Kalaireas