2016-11-18 27 views
0

私はRにLMを適用するとメモリを消費する他の変数も作成するため、約1GBのデータセットがメモリに適合しません)。この状況で分析を行うために、Rでこれらの素晴らしい機械学習パッケージ(例:glm、ランダムフォレスト、ニューラルネットなど)を使用する方法があるのだろうか?何か提案と参考に感謝します。大規模なデータセットにRの機械学習パッケージを適用する

+3

[HPCタスクビュー](https://cran.r-project.org/web/views/HighPerformanceComputing.html)の「大きなメモリとメモリ不足のデータ」セクションを確認してください。 –

答えて

2

high-performance task view on CRANを参照してください。特に、大きなメモリとメモリ不足のデータに関するセクションを参照してください。

また、お支払いになる場合がありますが、Microsoft R Serverをご利用ください。以前はRevolution R Enterpriseとして知られていたMRSは、大きなデータセットを扱う際にメモリの壁を壊すように設計されています。 WindowsとLinuxの両方で使用でき、SQL Server、Teradata、Hadoop(Cloudera、Hortonworks、HDInsight)とSparkを使用したデータベース内の分析も可能です。

開示:私はMicrosoftの従業員です。

1

スパークを使用できる場合は、sparklyr(無料)と考えてください。

+2

これは香港の答えには良いコメントがありますが、それは本当に答えではありません。 –

+0

答えは以下のとおりです。私は "コメント"を削除しました。 – dommer

関連する問題