私は現在、分類モデルの監督訓練を含むMLタスクを試しています。 これまでのところ、私は5Mのトレーニング例と交差検証の5Mの例があります。それぞれの例では、現時点では46個の機能がありますが、近い将来に10個以上を生成したいので、改善の余地があります。機械学習タスク:どのツールを使用するのですか?
私の問題は次のとおりです。この問題にはどのツールを使用しますか?ランダムフォレストやSVMを使いたいのですが、後者は私の場合は遅すぎるかもしれません。私はMahoutを考慮しましたが、コマンドラインスクリプトを使いこなすことで一定の構成を必要としているように見えます。私はむしろいくつかの(よく文書化された)ライブラリに対して直接コーディングするか、またはGUIで私のモデルを定義したいと思います。
また、私はWindows上で実行されるもの(cygwinなどのものはありません)を探していることを指定する必要があります。あなたは時間が来るとき、と想像することができます
、コードがAmazon EC2上Cluster Compute Eight Extra Large Instance上で実行されるので、RAMやマルチコアCPUの普及を作る何でも大歓迎です。
なく、少なくとも最後に、私は私のデータセットが密であることを指定しなければならないが(ミッシング値はありませんそれに/すべての列は、各ベクトルの値を持つ)
利用可能なツールが多数あります(初めは、KDnuggetsのソフトウェアリスト:http://www.kdnuggets.com/software/index.htmlを参照してください)。あなたの問題の説明はそれらのいくつかを削除しますが、それでも充分かもしれない数字が残っています。まさに「.NETでうまくいく」とはどういう意味なのか分かりませんが、価値のあるツールであれば、.NETコードに簡単に変換できるモデルのレポートやソースコードを提供する必要があります。 – Predictor
リンクをありがとう、私はこれを書いたとすぐにそれをチェックアウトします。 .NETでうまくいくということは、ジョブを開始するプログラマブルなインタフェースを持つもの、または.NETライブラリ(または使用可能なラッパー)でさえも、そうでないものよりも好ましいことです。 – em70