Im新しいpythonには助けが必要です! 私はPythonのNLTKテキスト分類で練習していました。ここ が、私はこの1つ from nltk import bigrams
from nltk.probability import ELEProbDist, FreqDist
from nltk import NaiveBayesClassifier
from collections imp
私は次のコードを持っています。私はapply_freq_filter機能を使用して、頻度カウントよりも小さいコロケーションを除外できることを知っています。しかし、フィルタリングのためにどの周波数を設定するかを決める前に、ドキュメント内のすべてのn-gramタプル(私の場合はバイグラム)の頻度を取得する方法はわかりません。ご覧のとおり、nltkコロケーションクラスを使用しています。 import n