最近データ分析にRを使い始めました。今では、大きなクエリデータセット(ASCIIモードでは1GB〜バイナリモードではラップトップの4GB RAM以上)のランキングに問題があります。エラー原因とnice溶液は、このデータセットのbigmemory::big.matrix
ある用いるが、gbm()
又はrandomForest()
アルゴリズムにおいて、そのような行列M '' を提供する:big.matrix as data.frame in R
cannot coerce class 'structure("big.matrix", package = "bigmemory")' into a data.frame
クラス(M)はfolowingを出力:
[1] "big.matrix"
attr(,"package")
[1] "bigmemory"
これらのアルゴリズムにbig.matrix
インスタンスを正しく渡す方法はありますか?
他のソリューションが失敗した場合は、Revolutionsを試してみてください。 'randomForest'をサポートしているかどうかは分かりませんが、大きなメモリの必要性をサポートしていると思います。たとえば、http:// www.revolutionanalytics.com/products/enterprise-big-data.phpを参照してください。それはプロプライエタリなソフトウェアであることに注意してください。無料のアカデミック版があります。 –
実際に使用している 'gbm'と' randomForest'呼び出しを提供できますか?具体的には、 'randomForest'の式インターフェイスを使用していますか? – joran