最近、mboost
を使用して、大量の独立変数を取り、有用な予測変数を特定しています。例えば:私はそれを理解するようR mboostの独立変数の相互作用を測定する
library(mboost)
xx=glmboost(data=mtcars,mpg~.)
、アルゴリズムは、別々に各従属変数を扱うと、勾配プロセスを通じて、重要な予測因子を特定しようとします。
しかし、多少複雑な相互作用があります。おそらくcyl
の効果は、wt
が増加するので、それほど重要ではありません。それは直感的に理解できます。 12サイクルの小型車はスポーツカーのようなもので、その時点での非効率なmpgのドライバーはcylです。しかし、トラックのために、それは本当に低mpgのドライバーである体重です。
mboostやその他のブースティングアルゴリズムを使用するときに、変数の(多分非線形の)相互作用効果をどのように扱いますか?
説明できないNNモデルまたはフォレストモデルへの道のりを望んでいません。これを処理するより良い方法はありますか?
私はブースティングアプローチが本当に好きです。その上の論文は読みやすく、結果は正常な人間にとって理解できるようです。しかし、あなたは相互作用があるときに完璧ではないフィット感が得られるようです。
おかげで、ジョシュ
(おそらく手の込んだ?)を確認してください、これは具体的な実装の問題ではなく、方法論であること。 –
まあ、私はそれぞれの少しを推測します。たぶん私はそれが間違っている? – JoshK
GBMまたはXGBoostパッケージを見ましたか?基本学習者にGLMを使用する必要がありますか?木は非常に柔軟です。 – Zelazny7