私は、各単語が全コーパスに何回出現するかを数えようとしています。
しかし、私はエラーを取得しています:私は取得しています全コーパス中のすべての剣の頻度をカウントする
corpus_root = os.path.abspath('../nlp_urdu/out1_data')
mycorpus = nltk.corpus.reader.TaggedCorpusReader(corpus_root,'.*')
noun=[]
count_freq = defaultdict(int)
for infile in (mycorpus.fileids()):
print(infile)
for i in (mycorpus.tagged_sents()):
texts = [word for word, pos in i if (pos == 'NN')]
noun.append(texts)
count_freq[noun]+= 1
print(count_freq)
エラーは次のとおりです。
count_freq [名詞] + = 1
TypeError
:非ハッシュの種類: 'リスト'
各キー必須と辞書です。 –