2017-04-01 23 views
1

機械学習では、どのように給与のような機能に対処する。たとえば、フィーチャに基づいてデータポイント間の距離を測定することによって、k最近傍点を適用する場合です。給料が2000000と6000の2つのポイントがあるとしましょう。その差は4000です。給与102000と106000の別の2つのポイントを見てみましょう。ここでの違いはまだ4000ドルですが、人間は最後の2ポイントを最初の2点。異なる範囲で異なる意味を持つ機能

機械学習にこのような直感を組み込むにはどうすればよいですか?

+0

私の友人を標準化して正規化する –

答えて

1

あなたは次のいずれか(および多く)行うことができます。

  • がへ
  • 2値化機能(更に多く102000未満、106000になりますので、2000年および6000)のログ機能を使用して機能を変換します代わりに、絶対差の相対見て複数のバケット(あなたが給与の各範囲に対する特徴を作成するであろうし、バケットを作成一つである)
  • K-NNの変化の類似機能
関連する問題