私はRにLMを適用するとメモリを消費する他の変数も作成するため、約1GBのデータセットがメモリに適合しません)。この状況で分析を行うために、Rでこれらの素晴らしい機械学習パッケージ(例:glm、ランダムフォレスト、ニューラルネットなど)を使用する方法があるのだろうか?何か提案と参考に感謝します。大規模なデータセットにRの機械学習パッケージを適用する
0
A
答えて
2
high-performance task view on CRANを参照してください。特に、大きなメモリとメモリ不足のデータに関するセクションを参照してください。
また、お支払いになる場合がありますが、Microsoft R Serverをご利用ください。以前はRevolution R Enterpriseとして知られていたMRSは、大きなデータセットを扱う際にメモリの壁を壊すように設計されています。 WindowsとLinuxの両方で使用でき、SQL Server、Teradata、Hadoop(Cloudera、Hortonworks、HDInsight)とSparkを使用したデータベース内の分析も可能です。
開示:私はMicrosoftの従業員です。
1
関連する問題
- 1. 大規模な機械によるウェブデータの学習
- 2. 機械学習の巨大なデータセットsklearn
- 3. Azureの機械学習 - データセット
- 4. 機械学習分類データセット
- 5. 大規模な機械学習プログラムのためにPythonプログラムをリモートで実行
- 6. R機械学習モデル - ブラインドテスト
- 7. チェッカーゲームでの機械学習の適用
- 8. RとrandomForestSRCパッケージを使用した機械学習
- 9. 多くのレベルの要素を扱うR機械学習パッケージ
- 10. 機械学習用レンタルサーバー
- 11. 機械学習が幾何学に適用された
- 12. 大規模なデータセットのSQL最適化
- 13. 機械学習のための大きなデータセットを扱うためのデザインパターン
- 14. 機械学習の学習に最適なプログラミング言語は何ですか?
- 15. 機械学習、テストに訓練モデルを適用する
- 16. 機械学習、Python
- 17. 機械学習システム
- 18. 機械学習udacity
- 19. Python - 機械学習
- 20. 機械学習モデルテスト
- 21. map reduceモデルを適用できない機械学習アルゴリズム
- 22. サンプルの正則化と機械学習の完全なデータセット
- 23. 深い学習と機械学習
- 24. 機械学習用の大型モデルファイルをホストしているAWS
- 25. 機械学習の文字列値を含むデータセットを探す
- 26. パラレルは* Azureの機械学習メーカーに適用
- 27. 機械学習のヌルクラス
- 28. ロボットでの機械学習
- 29. 機械学習のJavaライブラリ
- 30. 機械学習データのフォーマット
[HPCタスクビュー](https://cran.r-project.org/web/views/HighPerformanceComputing.html)の「大きなメモリとメモリ不足のデータ」セクションを確認してください。 –