2011-06-17 18 views
1

tf-idf weightを計算します。だから、idfを見つけるために私は別の文書の大きなデータベースが必要です。次に私はcolums-(word/count)で他のdbを作っています。 私の質問は、 "単語の" idf "(またはcount)coefの最後のデータベースはどこにありますか? 多くの検索エンジンがこのデータベースを使用しています。多分、このデータベースをインターネットでさまざまな言語で見つけることは可能でしょうか? 私はこのデータベースを自分で作成したくありません。単語の "idf" coefはどこで入手できますか?

答えて

2

idfは、Inverse Document Frequencyです。つまり、項の頻度は分母になります。だからあなたが望むのは単語頻度表です。 Wiktionary:Frequency listsを起動する必要があります。これらのリストは、単語の語形変化した形を同じ単語として扱うことを覚えておいてください。さようなら、ありがとうございます...

関連する問題