2017-01-22 9 views
1

現在、私はQDAを研究しており、Rソフトウェアを使用してデータを分析しています。データを標準化R

データは、以下のリンクからダウンロードした:

https://www.kaggle.com/uciml/pima-indians-diabetes-database

私は正規分布し、したがって

R.で以下のコマンドを使用している多変量されている2つのグループ、すなわちQDAの仮定を確認したいです
library(MVN)  
group1 <- discrim[1:500, 1:8] 
result<- mardiaTest(group1, qqplot = FALSE) #To check whether our data from group1 is MND  
group2 <- discrim[501:765, 1:8]  
result2 <- mardiaTest(group2, qqplot= TRUE)#To check whether our data from group2 is MND 

両方のグループが非正規分布であるため、データを正規化し、最初のグループのデータを正規化するために以下のコードを作成します。グループ2についても同様

x1bar <- t(t(as.vector(sapply(as.data.frame(group1),mean))))  
x1bartilda<- (x1bar - mean(x1bar))/sd(x1bar) 

誰もが楽しみください方法は何か私を助けることができる、しかし、グループ1の平均ベクトルXは0

に近い結果が得られませんでしたか?

+0

のですか?変数を標準化するためのグループ外の平均を使用すると、ゼロ平均の結果が得られません。 – AlexR

+1

私のデータを正規化し、データ上でqdaを続けるにはどうすればいいですか? –

+0

実際のデータ配信に依存し、[stats.SE]に適した質問です。 – AlexR

答えて

0

平均値0と標準偏差1で正規化する場合は、スケールコマンドを使用できます。

例:

my_data <- data.frame(x = rnorm(10, 30, .2), y = runif(10, 3, 5)) 
my_data_scaled <- scale(my_data) 

summary(my_data_scaled) 

結果は次のとおりです。

x     y   
Min. :-1.91046 Min. :-1.59037 
1st Qu.:-0.57552 1st Qu.:-0.39842 
Median : 0.06104 Median : 0.01998 
Mean : 0.00000 Mean : 0.00000 
3rd Qu.: 0.47280 3rd Qu.: 0.84296 
Max. : 1.74638 Max. : 1.10514 

平均が本当の問題は何ですか0

関連する問題