2016-04-07 10 views
-2

私はrの中に150,000行のdata.tableを持っています。 私は9つの機能を使用しており、トレーニング時間は30分以上です。私はもっと待っていませんでした。 また、500行(0.2秒かかる)で5000回(71.2秒)かかる。 どのように私はすべてのデータで私のモデルを訓練する必要がありますか私に他のアドバイスを与えることができるかもしれません?ここニューラルネットを使用してRで大きなデータセットを使用してニューラルネットワークを学習するにはどうすればよいですか?

は、ログをコンパイルします。

train1 <- train[1:5000,]+1 
> f1 = as.formula("target~ v1+ v2+ v3+ v4+ v5+ v6+ v7+ v8+ v9") 
> a=Sys.time() 
> nn <-neuralnet(f1,data=train1, hidden = c(4,2), err.fct = "ce", linear.output = TRUE) 
Warning message: 
'err.fct' was automatically set to sum of squared error (sse), because the response is not binary 
> b=Sys.time() 
> difftime(b,a,units = "secs") 
Time difference of 71.2000401 secs 
+0

あなたが何を求めているのかわからない! MATLABでは、NN Toolboxは、データの正規化、不足している定数や定数の削除、トレーニング、検証、テストのためのデータの分割など、ほとんどすべてを処理します。あなたは通常BIGデータを必要とせず、トレーニング/検証のためのサンプルとテストなどのための別のサンプルを取ることもできます。また、近似/回帰または分類には異なる伝達関数と異なる学習アルゴリズムを使用できます。 – Celdor

+0

MXNetは私が訓練用ニューラルネットワークのために見つけた最高のRパッケージです:http://myungjun-youn-demo.readthedocs.org/en/latest/R-package/ – Zelazny7

+0

あなたはそれを試していただきありがとうございますパッケージ。 –

答えて

1

これは私の経験で予想される、ニューラルネットに関わる計算がたくさんあります。私は個人的にはPython(2つの隠れた層)で書かれたものを持っていますが、勢いの言葉を含めて詳しく述べると、私は約38,000パターンの56入力と3出力を持っています。それらを8,000チャンクに分割すると、実行には約10分かかりました。私の満足を得るためには、1週間弱でした。

全体の38,000セットには、すべてのパターンを保存するために大きな隠れノードがあり、それは学習に1サイクルと3ヶ月以上かかるために6時間以上かかりました。ニューラルネットワークは非常に強力なツールですが、それは私の経験では価格で提供されていますが、他のものは実装が改善されているかもしれませんが、私が見た分類アルゴリズムのすべての比較は、

関連する問題