MapRにMahoutのようなKmeansクラスタリングがあるかどうか、具体的には疑問に思っていますか?MapRにスケーラブルな機械学習アルゴリズムがありますか? Mahoutのように?
0
A
答えて
5
私が知る限り、MapRは「高速な」Hadoopに過ぎません。アルゴリズムは含まれていません。
あなたの仕事は互換性があるはずです。
しかし、あなた自身の実装での取り引きは何ですか? K-手段は非常に簡単です。あなたはこの本の中でMahoutのベンチマーク結果と比較した場合 私が実施しているがhttp://codingwiththomas.blogspot.com/2011/05/k-means-clustering-with-mapreduce.html
はほぼ10倍高速であるBSP(バルク同期パラレル)とApache浜でk平均クラスタリング:私のブログの記事を参照してくださいhttp://www.manning.com/ingersoll/を(リンクJIRA:https://issues.apache.org/jira/browse/MAHOUT-588):http://wiki.apache.org/hama/Benchmarks
あなたがここでそれを見つけることができます: https://github.com/thomasjungblut/thomasjungblut-common/blob/master/src/de/jungblut/clustering/KMeansBSP.java
関連する問題
- 1. 機械学習 - 分類アルゴリズム
- 2. 反復機械学習アルゴリズム
- 3. パリティ機能の学習に成功した機械学習アルゴリズムはありますか?
- 4. 機械学習:どのアルゴリズムが答える質問に合う
- 5. 機械学習アルゴリズムは、学習したデータをコピーしますか?
- 6. 序数データを学習できる機械学習回帰アルゴリズムはありますか?
- 7. 機械学習によるプラントのマッピング
- 8. Python - 機械学習
- 9. 機械学習、Python
- 10. 機械学習モデルのサイズが異なりますか?
- 11. 機械学習モデルテスト
- 12. 機械学習と進化アルゴリズムを比較できますか?
- 13. 機械学習システム
- 14. 機械学習udacity
- 15. いくつかの機械学習アルゴリズムは何ですか
- 16. 機械学習によるテキストラベリング
- 17. 深い学習と機械学習
- 18. 2次元座標を値にマッピングする機械学習アルゴリズム
- 19. map reduceモデルを適用できない機械学習アルゴリズム
- 20. 機械学習のヌルクラス
- 21. ロボットでの機械学習
- 22. 機械学習のJavaライブラリ
- 23. 機械学習データのフォーマット
- 24. GATEの機械学習
- 25. 機械学習の提案
- 26. C#の機械学習ライブラリ
- 27. Azureの機械学習 - データセット
- 28. 機械学習アルゴリズムから否定結果を得る
- 29. 機械学習アルゴリズムの "重み"はどういう意味ですか
- 30. 機械学習分類データセット
おお は、ここではApacheハマでのk-means法のベンチマークです!私はこれらのリンクを見ます!ありがとう.... –
MapRはもっと速いHadoopではありません。これには標準のエコシステムコンポーネントもすべて含まれています。これにはMahoutが含まれます。 –
Hadoopのmap-reduceの実装は、Lloydのアルゴリズムを使用する従来のk-meansのような反復アルゴリズムには適していないということは間違いありません。シングルパスk-means解析を可能にするJIRAオープンがあります。シングルパスなので、このアルゴリズムはデータを複数回通過する必要はなく、動作させるためにmap-reduceを複数回呼び出す必要はありません。スピードアップは、トーマスが説明しているものに匹敵するはずです。 –