txtファイルのコロケーションを一覧表示する

Dracula.txtのNLTKによって報告されたコロケーションをリストしたいとします。私はこれをどのようにして行うのですか？私はそれを私のコーパスに追加することによって単語の頻度を見つけることができます。私はDraculaのテキストからの単語を持つ変数DracWords dracWords = mycorpus.words('Dracula.txt')も持っています。これから私は頻度分布を行うことができますが、私が今したいのは、そこから連鎖をリストすることです。txtファイルのコロケーションを一覧表示する

何か助けていただければ幸いです。

出典

2017-01-24 Kimberly James

あなたのコードはどこですか？ –

[テキストでの連鎖を見つける方法、python]（http://stackoverflow.com/questions/4128583/how-to-find-collocations-in-text-python） – DyZ

これはnahから取得していますtxtはすでにコーパスに追加されています。 –

ありがとうございました。

nltk.Text(mycorpus.words('Dracula.txt')).collocations()

出典

2017-01-24 07:52:19

あなたはこの試みることができます：

from collections import Counter 

text = 'List the collocations for a txt file' 
words = text.split() 
nextword = iter(words) 
next(nextword) 

print(Counter(zip(words, nextword)))

をそして、あなたが取得します：

Counter({('txt', 'file'): 1, ('List', 'the'): 1, ('collocations', 'for'): 1, ('for', 'a'): 1, ('the', 'collocations'): 1, ('a', 'txt'): 1})

は、この情報がお役に立てば幸いです。

出典

2017-01-24 07:17:45 McGrady

txtファイルのコロケーションを一覧表示する

答えて

関連する問題