2017-05-17 12 views
1

私は以下を持っていますdata.tableです。h2oを使用した多項式回帰における部分依存グラフ

fixed acidity volatile acidity citric acid residual sugar chlorides free sulfur dioxide total sulfur dioxide density pH 
    1:   7.0    0.27  0.36   20.7  0.045     45     170 1.00100 3.00 
    2:   6.3    0.30  0.34   1.6  0.049     14     132 0.99400 3.30 
    3:   8.1    0.28  0.40   6.9  0.050     30     97 0.99510 3.26 
    4:   7.2    0.23  0.32   8.5  0.058     47     186 0.99560 3.19 
    5:   7.2    0.23  0.32   8.5  0.058     47     186 0.99560 3.19 

sulphates alcohol quality 
    1:  0.45  8.8 Bad wine 
    2:  0.49  9.5 Bad wine 
    3:  0.44 10.1 Bad wine 
    4:  0.40  9.9 Bad wine 
    5:  0.40  9.9 Bad wine 

私は、このデータセットにGLMを訓練する

system.time(model_glm <- h2o.glm(x = 1:11, y = 12, training_frame = wine.train.h2o, 
           validation_frame = wine.test.h2o, seed = 42, 
           family = "binomial")) 

を実行することができます。その後、部分的な依存関係のプロットを得るために私は私の場合は

glm_pp <- rbindlist(lapply(glm_pp, function(x){melt(x, id.vars="mean_response")})) 
ggplot(glm_pp, aes(x=value, y=mean_response)) + geom_point() + facet_wrap(~variable, scale="free_x") + 
    geom_smooth(method="loess") + theme_pl() + ggtitle("Partial dependence plot") 

を使用することができ、私のybinary variableある、qualityです。

dependent variableに3つ以上のカテゴリがある場合、どのように部分的依存性プロットを得ることができますか。したがって、family = multinomialを使用してglmを実行した場合、

答えて

1

現在、H2Oは、部分依存関係の実装において、2項モデルと回帰モデルをサポートしています。多項式モデルはまだ互換性がありません。

nav

関連する問題