私は、1000行以上の20の属性(列に表示)を持つ一連のデータを持っています。 平均のセンタリングを使用したいと思っています。平均値を0にすることが含まれます。アトリビュートの平均をアトリビュート単位で削除するのか、それともすべてのアトリビュートの平均を削除しますか?統計平均センタリング - 合計平均または属性平均の使用
たとえば、属性Aの平均が500で、属性Bの平均が1,000の場合。私はAを与える、500を削除することができA内のすべての値について が0の平均値を属性それから私は、私は両方の属性のすべての値オフ750を取ることができる属性B.
OR
について同じことを行うことができます。
どちらが統計的に正しいですか?
私の質問はこれによるものです: 異なる属性から異なる値を差し引くと、それぞれの属性から異なる量が取られているので、属性はもはや比較できなくなります。私がすべての値から同じ値を引いた場合、いくつかの列は負の数字でいっぱいになることがあります(そして、平均のセンタリングの効果を否定します)。
おかげで、
ありがとう、それは素晴らしい説明であり、本当に役立ちます。 – ThePerson