2017-08-28 10 views
-1

私は機能の選択について学んでいます。 私はthisを見つけました。多くのカーネルが相関係数行列をチェックしています。 (上のリンクでは、3種類の特徴選択法を紹介しています。最初に、相関係数とカイ二乗検定を含むフィルタ法です)フィーチャ選択に相関係数を使用するのはなぜですか?

なぜフィーチャ選択に相関係数を使用できますか?

私は、2つ以上の変数または非線形関係の組み合わせの効果を表すことができないように、2つの変数間の線形関係のみを示すことができると思います。

相関係数がフィーチャ選択に適しているのだろうかと思います。 なぜ機能選択に使用できますか?

+0

編集:今すぐリンクします –

答えて

1

あなたは完全に右相関が素朴でほぼ基本的な特徴選択方法です。その結果、時には(データが時には線形結合の冗長性に従うため)、多くのより複雑な作業で惨めに失敗することがあります。ここには「黄金の」答えはありません。相関に基づく特徴選択は、分類のためのロジスティック回帰のようなものです - 試してみるのが最も簡単ですが、問題を解決することは期待してはいけません。

+0

ありがとう!私はさらに2つの質問があります。 1.なぜ多くの人々が相関係数行列をチェックするのですか?変数の冗長性をチェックするには? 2.次に、機能の選択に、より効果的または一般的に使用される方法をお勧めしますか? –

+0

1.はい、高い相関は冗長変数を示唆すべきです。一方、相関の欠如は実際には何の意味もありません。 2.非常に中核的な機能の選択は難しい問題です。適切な最適化ができない**離散的な**決定が必要です。注意してください。より良い分類をするために行うのであれば、しないでください。フィーチャ選択は、フィーチャ収集が高価な場合(たとえば、医療診断の場合)にのみ適用する必要があります。典型的な非線形機能選択メカニズムには、ランダムフォレストなどの機能の重要性を割り当てることのできるトレーニングモデルが含まれています。 – lejlot

+0

アドバイスありがとうございます! –

関連する問題