-1

XとYは相関しない(0.3)。しかし、Xを2つ(A、B)の他の(関連する)変数と共にYを予測するランダムフォレスト分類子にXを入れたとき、Xと他の2つの変数(A、B)はYの重要な予測子です。 B)変数もYと相関していません。 統計と機械学習の考え方に従って、これをどのように解釈できますか?XとYは相関関係はありませんが、YはXinランダムフォレスト分類子の予測子です。統計と機械学習を使ってこれを表現する方法は?

変数が強い相関性を持たない別の変数(X)に対して1つ以上の変数(A、BまたはY)を表す。

+0

で見つけることができます – Pace

答えて

0

相関は線形です。非線形の関係がある場合は、ほとんどまたはまったく相関がないことがあります。

ランダムフォレスト(および決定木は非線形です)ので、相関がゼロの場合でも予測的なランダムフォレストが見つかる可能性があります。

A quadratic function could have zero correlation between X and Y

この画像との相関関係についての詳細は、これはhttps://stats.stackexchange.com/のためのより良い質問かもしれ https://www.statisticalengineering.com/correlation.htm

関連する問題