Rの列を因数分解することを選択する際には何らかの前提がありますか?私は要因に変換すると、randomForestのようなもののレベルが高すぎるという文字列があるので、これを尋ねます。文字として保管することに不利な点はありますか?Rの列を因数分解するときの良い経験則は何ですか?
3
A
答えて
4
私は通常、ほとんどのプロジェクト(例えば、読書、清掃、操作)の要素ではなく、文字を変数として扱いたいと思います。私は通常、分析に先立って因子に移します。現状では、因子変数の記憶を明示的に使用するために私が知っている主な理由は、ダミーを含む線形モデルで左アウトのカテゴリを制御するなど、分析のベースレベルを明示的に制御することです。
以前は、変数を要素として保持する最大の利点は、メモリを節約することでした(数年前)。因数変数は整数ベクトルとして多かれ少なかれ格納されていました。文字ベクトルと比較して、特に繰り返し要素がある場合には、はるかに少ないスペースしか占めませんでした。 @MichaelChiricoが私に以下のように指摘したように、これはかなりの間(2.8前後のどこか)のケースではありませんでした。
関連する問題
- 1. データベースインデックスを作成するためのベストプラクティスと「経験則」は何ですか?
- 2. @propertyアトミシティの経験則は?
- 3. PHPディレクトリの経験則は?
- 4. 多数のパネルとJScrollPaneとsetPreferredSize()を操作するときの経験則
- 5. SIMDの方が速い場合の経験則は何ですか? (SSE2、AVX)
- 6. RESTfulウェブサービスの経験則
- 7. ARM Jazelleの経験は何ですか?
- 8. メッセージング/メッセージキューに関する経験則
- 9. R - データフレームと因数分解変数のトラブルシューティング
- 10. Zend Frameworkのモジュール数についての経験則
- 11. C++ Jobqueue:ワーカースレッドの数について経験則がありますか?
- 12. パンダの複数列因子分解
- 13. Pythonの経験的データにべき乗則を適合
- 14. GAEフロントエンドインスタンスクラスを設定するための経験則
- 15. Javaに経験的分解ライブラリがありますか?
- 16. パンダで選択した列を因数分解する方法
- 17. Pythonの因数分解
- 18. Javaの素因数分解
- 19. $ scopeを使用してコントローラコードを因数分解する最良の方法
- 20. フォームコントロールの動的作成に関する「経験則」はありますか?
- 21. SAS BI Dashboardのフィードバック - あなたの経験は何ですか?
- 22. プログラム的に大きな数値を因数分解する
- 23. ReactJSで使用される非反応成分を試験する良い方法は何ですか?
- 24. r:他のクラスを残している間に因数分解する文字変数を強制する
- 25. R - replicate与えられた行列の分数因数設計
- 26. Sun CoolThreadsテクノロジーの経験は何ですか?
- 27. 解析エラー - 原因は何ですか?
- 28. メイヴェンを理解するのに良いリソースは何ですか?
- 29. ハスケルでの素因数分解
- 30. nグラムモデルでnの経験的に見つかった最良の値は何ですか?
メモリを節約したとは本当に間違いありません。http://stackoverflow.com/a/13570765/3576984 – MichaelChirico
歴史的な文脈は決して傷つきません。 – lmo
はい私は歴史的な文脈についても同意します。非常にきちんとした説明。 –