2017-05-28 8 views
0

私の音はとても素朴な質問です。私はgoogleと初心者のための多くのYouTube動画をチェックしていて、すべてがデータの重み付けを最も明白なものとして説明しています。私はまだデータが加重されている理由を理解していません。私はSigmond関数にそれぞれの値を渡すと、私が届きます-1> < 1値すでに機械学習、私たちはなぜデータを体重調節する必要があるのですか

a b c d 
1 2 1 4 

はのは、私は4つの特徴を持っていると仮定しましょう。

なぜデータが必要なのか、最初に重み付けすることをお勧めします。私にこれを非常に簡単な方法で説明できるなら、私はそれをたくさんいただきたいと思います。

+0

大きな一桁あなたは計量データで何を意味するのか説明してあるように、関係に置かれる必要があります。マシン学習パイプラインのどの部分にこれが適用されていますか? – Atreys

+0

sigmond関数に適用される前のそのフィーチャ値は、実際に乗算された-1から1で重み付けされています。しかし、私はなぜ、なぜ全体のプロセスで体重が必要なのか分からないのですか? – Makaroniiii

+0

データ値が常に正の大きな数値である場合、それらの入力を使用するシグモイド関数(sigmond関数ではない)の値は何ですか? – beaker

答えて

0

私はあなたが重量データではなく機能について話していると思います。 フィーチャはテーブルの列であり、データとしては行を理解します。

今や、プラスのクラスの誤分類をもっと罰する場合など、行の重さが時には分かりやすいという事実から混乱が生じることがあります。

フィーチャを体重計する必要があるのはなぜですか?私はあなたが

prediction = sigmoid(sum_i weight_i * feature_i) > base 

ようmodleについて話していると仮定し はあなたが人は体重、身長、年齢に基づいて、太りすぎであるかどうかを予測したいとしましょう。私たちは今、あなたはデータの少なくとも私のサンプルは、体重/身長に直線で分離できることを見ることができるデータをプロットした場合、我々は

height = rnorm(100,1.80,0.1) #normal distributed mean 1.8,variance 0.1 
weight = rnorm(100,70,10) 
age = runif(100,0,100) 
ow = weight/(height**2)>25 #overweight if BMI > 25 
data = data.frame(height,weight,age,bc,ow) 

としてサンプルデータセットを生成することができますRで

。しかし、年齢は価値を提供しません。 sum/sigmoidの前に重み付けすると、すべての要素を関連付けることができます。次のプロットから見ることができるよう

enter image description here

さらに、重量/高さが非常に異なるドメインを持っています。したがって、彼らは以下のプロットの行は、右の傾斜を有する重量の値が持っているよう

enter image description here

関連する問題