1
tf-idf weightを計算します。だから、idfを見つけるために私は別の文書の大きなデータベースが必要です。次に私はcolums-(word/count)で他のdbを作っています。 私の質問は、 "単語の" idf "(またはcount)coefの最後のデータベースはどこにありますか? 多くの検索エンジンがこのデータベースを使用しています。多分、このデータベースをインターネットでさまざまな言語で見つけることは可能でしょうか? 私はこのデータベースを自分で作成したくありません。単語の "idf" coefはどこで入手できますか?