2016-07-10 17 views
0

WEKAを使用して分類しています。 JavaコードでWEKA jarファイルを使用しています。私のトレーニングのデータセットは56000のインスタンスと1253のフィーチャを持っています。私はロジスティック回帰、J48​​、ランダムフォレストランダムツリーなどのような単純な分類アルゴリズムを使用しています。私はランダムフォレストのみの結果を得ることができます。他の分類子のためのトレーニングモデルを作成している間、私のプログラムは6〜7時間稼働し続けましたが、何の結果もエラーもありませんでした。WEKAの大規模トレーニングデータセット(Javaコード)

大規模なデータセットでWEKAクラシファイアを訓練するためのより早い方法をお勧めします。

ありがとうございます!

答えて

3

機械学習アルゴリズムのwekaの実装では、メインメモリ内のデータセット全体がロードされるため、モデルを訓練するのに時間がかかることがあります。この点については、コマンドライン経由でWekaを使用すると役立ちます。また、トレーニング時間を短縮できるいくつかの方法があります。彼らはhttp://www.cs.waikato.ac.nz/ml/weka/bigdata.html

に寄付されています。

関連する問題