確率的勾配降下を介してパラメータを学習したムービー定格のベースライン予測モデル(NetFlix賞のさまざまなベースラインモデルに類似)を実装しようとしています。しかし、両方の説明変数がカテゴリ(ユーザーと映画)なので、デザインマトリックスは本当に大きく、自分のRAMに収まらない。確率的勾配降下設計行列が大きすぎるためR
大量のデータ用に設計されているので、sgdパッケージがこの問題を自動的に検出すると思っていましたが、そうではありません。
これを回避する方法を知っている人はいますか?おそらく、疎な行列として設計行列を構築する方法です。
乾杯、
どうもありがとう、xgboostチュートリアルは本当に便利です! –
よろしくお願いします! –