2017-04-20 15 views
0

私が持っているデータセット:model.matrixによるglmnet(LASSO)のダミー変数の作成方法は?

 SalesPrice SqFeet Beds Baths AirCond Garage Pool Year Quality Style Lot  Highway 
    1:  360.0 3.032 4  4  1  2 0 1972  2  1 22.221  0 
    2:  340.0 2.058 4  2  1  2 0 1976  2  1 22.912  0 
    3:  250.0 1.780 4  3  1  2 0 1980  2  1 21.345  0 
    4:  205.5 1.638 4  2  1  2 0 1963  2  1 17.342  0 
    5:  275.5 2.196 4  3  1  2 0 1968  2  7 21.786  0 

私がモデルを作成したい:

model.lm2 <- glmnet(x = xvars,y = df[,SalesPrice],alpha = 1,family = 'gaussian',lambda = CV$lambda.1se) 

をしかし、私の場合、私は因子変数「スタイル」を持っていると私は変更されません場合、変数glmnetをダミーします関数は数値変数と同様に動作します。

したがって、model.matrixによってglmnet(LASSO)のダミー変数を作成するにはどうしたらいいですか?

答えて

0

私のglmnetUtilsパッケージを使用することができます。これはすべてこれを行います。 CRANにはまだありませんが、まもなくそこにいるはずです。その間、devutoolsを使ってGithubリポジトリからインストールしてください。

devtools::install.github("hong-revo/glmnetUtils") 
library(glmnetUtils) 

model.lm2 <- glmnet(SalesPrice ~ ., data=df) 
+0

この関数はfactor変数をダミーとして扱いますか? –

関連する問題