2016-08-23 19 views
0

私は、バイナリに依存する変数と参加者を含む多くの予測変数を持つデータセットを持っています。私は、異なる参加者の異なる予測変数の特異な影響を調べようとしています。そのためには、参加者IDと他のプレディクタの間の相互作用が従属変数に及ぼす影響を調べようとしています。私はRでrandomForestを使用しています。フォレストにうまく収まり、個々の変数の部分依存グラフを生成することができます。しかし、私が必要とするのは、変数のペア(参加者+その他)の部分依存グラフです。これは可能ですか?参考のためR個のrandomForestの二変量部分的依存R

、私のコード:誰が提供できる任意のアドバイスのための非常に事前に

data_sample<-data_raw[sample(1:nrow(data_raw),500,replace=F),]; 
test_rf<-randomForest(perceptually.rhotic~vowel+speaker+modified_clip_start+function_word+year_of_birth+gender+fathers_job_type+prepausal,data=data_sample,ntree=500,mtry=3); 
partialPlot(test_rf,pred.dat=data_sample,x.var="speaker"); 

??? partialPlot(test_rf,pred.dat=data_sample,x.var=c("speaker","vowel")); 

ありがとう!

答えて

2

plotmo Rパッケージは、「すべての」モデルのすべての変数と変数のペア(2変数の依存関係)の部分依存関係をプロットします。たとえば:

plot http://www.milbo.org/doc/plotmo-randomforest-trees.png

を与える

library(randomForest) 
data(trees) 
mod <- randomForest(Volume~., data=trees) 
library(plotmo) 
plotmo(mod, pmethod="partdep") # plot partial dependencies 

あなたは、変数と変数のペアがplotmoのall1all2degree1、およびdegree2引数を使用してプロットを受けるかを正確に指定することができます。追加の例はvignette for the plotmo packageにあります。

関連する問題