ドキュメント内で最大の出現数を持つ単語を検索するのに最も最適な方法(アルゴリズム)は何ですか?出現数が最大の単語を検索する
2
A
答えて
2
単純histogramによりO(N)で行うことができる[ハッシュベース】問題は明らかにオメガ(n)の問題です、それはbig O notationの点で最適です。
+1
とにかく、最適な予想ケース。 –
+0
ハッシュマップの代わりに[trie](http://ja.wikipedia.org/wiki/Trie)は決定的なO(n)ワーストケースを与えますが、実際には遅くなる可能性があります。 – comco
2
- 一意のすべての単語を何回見たのか(おそらくハッシュテーブルまたはこれを行うツリーを使用して)、ドキュメントを一度スキャンしてください。
- 手順1を実行している間に、これまでに見られたすべての単語の中で最も多くカウントされている単語を追跡します。
histogram <- new map<String,int> for each word in document: if word in histogram: histogram[word] <- histogram[word] + 1 else: histogram[word] <- 1 max <- 0 maxWord<- "" for each word in histogram: if histogram[word] > max: max <- histogram[word] maxWord <- word return maxWord
これはO(n)の溶液、及び以降:文書の中で最も時間をoccures単語を見つける
が
関連する問題
- 1. Hadoop Mapleduceで最大の単語を取得する単語数
- 2. MongoDBテキスト検索と複数の単語を含む単語の検索
- 3. 単語の先頭と次の単語を検索する正規表現
- 4. グループの最大数を検索する
- 5. 単語を検索する
- 6. 正規表現:最初に '%'を含む単語を検索する
- 7. 検索ツールの単語を除外する正規表現
- 8. JQGridツールバー検索:列の複数の単語を検索
- 9. 特定の単語の出現回数をPythonで検出する方法
- 10. 単語検索アルゴリズム
- 11. 検索バーで複数の単語を検索したい
- 12. Pythonでは、別の単語の出現後に単語の最初の出現を照合する
- 13. 単語の最初の文字が一致する場合、文字列のリスト内の単語の出現を検索し、ハイライト一致した単語を検索します。JavaScriptの正規表現
- 14. 複数の単語の単語の出現数をカウントする問題
- 15. SolrNetファジー検索複数の単語
- 16. 文字列の最後の単語を検索するSQL文
- 17. 単一検索で複数の単語を検索するNSPredicateを使用してiOSを迅速に検索
- 18. 単語の袋の中の単語を検索する
- 19. リスト内で最も頻繁に出現する単語を検索します(頻度なし)
- 20. 周波数表のColの最大値をR言語で検索する
- 21. 複数のファイルを複数の単語で検索する
- 22. 複数の単語を複数のモデルで検索する
- 23. aiml - 最後に単語が出現する
- 24. 件名の最大数リストを検索
- 25. 単語文書内の単語を検索するには
- 26. データベース内の単語を検索する
- 27. 単語のテキストファイルを検索する
- 28. URLエラーの単語を検索する
- 29. PHP Mysqli単語の最初の文字で検索する
- 30. 正規表現の前後に5単語を検索する正規表現
何回の最大発生回数ですか? – DeCaf
その文書内の**単語**の最大出現回数 – Saket
文書内で最も多く出現する単語をお探しですか?単純なヒストグラムがO(n)でトリックを行います。 – amit