2
次のテキストファイルがあります(hereからダウンロードできます)。Python - NLTKでテキストを検索
私はファイルlanguage
を検索しようとしています。そのために、私は次のPythonスクリプトを持っている:私は、しかし、プログラムを実行すると、ファイルが単語language
が含まれていますが、
import nltk
file = open('NLTK.txt', 'r')
read_file = file.read()
text = nltk.Text(read_file)
match = text.concordance('language')
print(match)
、私は次のような出力が得られます。
No matches
None
なぜプログラムではありませんでしそのファイルにはlanguage
という単語がありますか?
EDIT 1
私は声明text = nltk.Text(read_file)
戻っていることに気づい:
<Text: T h i s i s ...>
感謝。
問題を解決する方法について正しい答えがありますが、ここにもう1つのアドバイスがあります: 'Text'クラスで作業することを忘れないでください。インタラクティブな探索とデモンストレーションのためだけに設計されています。 'PlaintextCorpusReader'(および注釈付きフォーマットのそれに対応するもの)に直接行ってください。 – alexis