2016-07-15 9 views
1

私は、scipyのks_2samp関数を使ってKolmogorov-Smirnoffテストを実行して、データのヒストグラムが同じ分布から来たものかどうかを調べようとしています。返されたp値はかなり右時々しかしいないようです...2サンプルKSテスト - 何かが間違っているようです

このヒストグラムを持つ例:

Histogram.jpg

aa, bb, cc = ax1.hist(list1, numpy.arange(a-1, b+3, c), alpha = .5, align = 'mid', rwidth=1, linestyle = 'dashed', linewidth = 1.5) 

dd, ee, ff = ax1.hist(list2, numpy.arange(a-1, b+3, c), alpha = .5, align = 'mid',rwidth=1) 

print ks_2samp(aa, dd)`[1]` 

私は約0.96で返されたp値を取得し、本当に正しいとは思わない...私は何か間違っている?これらのヒストグラムは、p値が低くなるほど十分に異なるべきではありませんか?

+1

何あなたはおそらくやりたいこと、それは私が感謝を探しているまさに 'ks_2samp(リスト1、リスト2)面白い' – cel

+0

えっです!今、私は、1.8e-5のp値を得て、これは道理にかなっています。私はヒストグラムを分析していたので、関数がそのように機能していないと思っていた...私には直感的ではないかもしれないが、関数が実際にどのように実際に動作するかを理解していないかもしれない。 – MrDinkleburg

+2

@cel (実際は* *)の答えです。 –

答えて

3

ks_2sampは、2つのサンプルにKolmogorov-Smirnov検定を適用し、両方が同じ分布に由来するという帰無仮説を検定します。

したがって、ks_2sampは入力として2つのサンプル(ここではlist1list2)を取ります。

ks_2samp(list1, list2) 
関連する問題