2016-12-09 7 views
-2

現在、私はh2o.aiSparkMLlibを使って機械学習ライブラリに関するアンケートを行っています。私はより多くのMLアルゴリズムがSparkMLlibと比較してh2o.aiライブラリによってサポートされていることを確認しました。スパークデータフレームのトレーニングとテストセットへの分割は難しいようです(スパークデータフレームをR/h2oデータフレームに変換する必要がありますまた、時間/リソースの消費)。機械学習アルゴリズムの視点からのh2o.aiとSparkMLlibの相違

ライブラリをSparkMLib以上に使用した場合の他のメリットとデメリットは?私はh2o.aiSparkMLlibをRベースの実装(SparkR)に集中しています。したがって、h2o (as.h2o)とSparkMLlib (as.DataFrame)のデータフレームは異なります。

答えて

3

一部、私は理解アウトの答えを以下のリンクを使用して:http://datasocial.onsocialengine.com/post/4171645/spark-mllib-or-h2o

詳細な比較分析がここで提供される:ベンチマーキングの結果のhttps://github.com/szilard/benchm-ml

スライド:ベンチマーキングのhttps://speakerdeck.com/szilard/benchmarking-machine-learning-tools-for-scalability-speed-and-accuracy-la-ml-meetup-at-eharmony-june-2015

ビデオ結果:https://vimeopro.com/eharmony/talks/video/132838730

機械学習ライブラリの分析に関する技術レポート:https://github.com/chauhansaurabhb/Analysis-of-H2O-vs-SparkMLlib/blob/master/MLLibrary.pdf

関連する問題