3
私はNAs
のデータセットを広範囲に振りかけました。因子()とNAsのRキャレット/ rfe変数の選択
さらに、列にはfactors()
が必要です。
caret
パッケージのrfe()
機能を使用して、変数を選択しています。
因子変数ではなく、NASに対してrfFuncs
作品ながらこれは、lmFuncs
NASとのデータのための作品ではなく、因子変数のを使用してrfe()
でfunctions=
引数を思わ。
これに対処するための提案はありますか?
私はmodel.matrix()
を試しましたが、それはもっと問題を引き起こすようです。
「lmFuncs」はいくつかの変数を要因として失敗します。私は再現可能な例で確信することができた。ランダムフォレストが(デフォルトで)NAsのケースを受け入れないという事実は、単にそのアルゴリズム(または少なくともRバージョン)の十分に文書化された「機能」です。あなたがNAsをシームレスに扱うツリーベースのモデルを望むなら、 'treebagFuncs'はより安全な賭けかもしれません(しかし、私はそれをテストしていません)。 – joran