2017-03-05 7 views
0

タグの数が最も多いものから最も低いものまで、単語とそのタグのリストをソートしたいと思います。それは、1個の以上のタグを持っているすべての単語のリストを出力複数のタグに基づいてコーパス内の単語を並べ替えるにはどうすればよいですか? Python、nltk

from collections import defaultdict 

tagged = defaultdict(set) 
for w in brown: 
    tagged[w[0]].add(w[1]) 

for word in tagged: 
    if len(tagged[word])>1: 
     print (word, tagged[word]) 

これまでのところ、私はこれを持っています。注文を降順に並べ替える方法は?それが降順に、値の長さによって、すべてのエントリをソートします

items = sorted(tagged.items(), key=lambda item: len(item[1]), reverse=True) 
for word, tags in items: 
    if len(tags) <= 1: 
     break 
    print(word, tags) 

答えて

1

はこれを試してみてください。 長さ1のエントリが印刷される前にループが停止します。

+0

ありがとうございました。ヘルプ@lenz :) – Ewa

関連する問題