データを標準化R

現在、私はQDAを研究しており、Rソフトウェアを使用してデータを分析しています。データを標準化R

データは、以下のリンクからダウンロードした：

https://www.kaggle.com/uciml/pima-indians-diabetes-database

私は正規分布し、したがって

R.で以下のコマンドを使用している多変量されている2つのグループ、すなわちQDAの仮定を確認したいです

library(MVN)  
group1 <- discrim[1:500, 1:8] 
result<- mardiaTest(group1, qqplot = FALSE) #To check whether our data from group1 is MND  
group2 <- discrim[501:765, 1:8]  
result2 <- mardiaTest(group2, qqplot= TRUE)#To check whether our data from group2 is MND

両方のグループが非正規分布であるため、データを正規化し、最初のグループのデータを正規化するために以下のコードを作成します。グループ2についても同様

x1bar <- t(t(as.vector(sapply(as.data.frame(group1),mean))))  
x1bartilda<- (x1bar - mean(x1bar))/sd(x1bar)

誰もが楽しみください方法は何か私を助けることができる、しかし、グループ1の平均ベクトルXは0

に近い結果が得られませんでしたか？

出典

2017-01-22 Annalise Azzopardi

のですか？変数を標準化するためのグループ外の平均を使用すると、ゼロ平均の結果が得られません。 – AlexR

私のデータを正規化し、データ上でqdaを続けるにはどうすればいいですか？ –

実際のデータ配信に依存し、[stats.SE]に適した質問です。 – AlexR

平均値0と標準偏差1で正規化する場合は、スケールコマンドを使用できます。

例：

my_data <- data.frame(x = rnorm(10, 30, .2), y = runif(10, 3, 5)) 
my_data_scaled <- scale(my_data) 

summary(my_data_scaled)

結果は次のとおりです。

x     y   
Min. :-1.91046 Min. :-1.59037 
1st Qu.:-0.57552 1st Qu.:-0.39842 
Median : 0.06104 Median : 0.01998 
Mean : 0.00000 Mean : 0.00000 
3rd Qu.: 0.47280 3rd Qu.: 0.84296 
Max. : 1.74638 Max. : 1.10514

平均が本当の問題は何ですか0

出典

2017-07-02 16:37:50 sera

答えて

関連する問題