def getWordFreq(corpus):
wordFreq = []
for sent in corpus:
for word in sent:
wordFreq.append((word, sent.count(word)))
return wordFreq
コーパス内の各単語の頻度を取得するためにこの関数を書きました。それをテストする文のリストの単語頻度を取得しますが、結合しません。 (Python)
が、私は
cc = [ ['hi','ho'], ['hee','ho']]
getWordFreq(cc)
を書いたが、これは代わりの
[('hi', 1), ('ho', 1), ('hee', 1), ('ho', 1)]
を返された( 'HO'、2)。
私には何が欠けていますか?あなたはこの作業のために辞書を使用したほうが良いと思います
from collections import Counter
def getWordFreq(corpus):
wordFreq = [j for i in corpus for j in i]
return list(Counter(wordFreq).items())
'カウントは+ = 1 '(そう'カウントは+ = sent.count(ワード) ')?最後に最初の値を変更し、追加しません! – dsgdfg
**は一体何を意味するのですか? – RomanPerekhrest
'コーパス'全体に含まれていない 'sent'の各単語をカウントしています – Unni