2017-01-24 10 views
0

Dracula.txtのNLTKによって報告されたコロケーションをリストしたいとします。私はこれをどのようにして行うのですか?私はそれを私のコーパスに追加することによって単語の頻度を見つけることができます。私はDraculaのテキストからの単語を持つ変数DracWords dracWords = mycorpus.words('Dracula.txt')も持っています。これから私は頻度分布を行うことができますが、私が今したいのは、そこから連鎖をリストすることです。txtファイルのコロケーションを一覧表示する

何か助けていただければ幸いです。

+0

あなたのコードはどこですか? –

+0

[テキストでの連鎖を見つける方法、python](http://stackoverflow.com/questions/4128583/how-to-find-collocations-in-text-python) – DyZ

+0

これはnahから取得していますtxtはすでにコーパスに追加されています。 –

答えて

0

ありがとうございました。

nltk.Text(mycorpus.words('Dracula.txt')).collocations() 
1

あなたはこの試みることができます:

from collections import Counter 

text = 'List the collocations for a txt file' 
words = text.split() 
nextword = iter(words) 
next(nextword) 

print(Counter(zip(words, nextword))) 

をそして、あなたが取得します:

Counter({('txt', 'file'): 1, ('List', 'the'): 1, ('collocations', 'for'): 1, ('for', 'a'): 1, ('the', 'collocations'): 1, ('a', 'txt'): 1}) 

は、この情報がお役に立てば幸いです。