2017-05-26 4 views
2

P値を見つけるのが理想的です。私はより多くの統計の背景から来て、かなり新しいPythonです。私にこれを可能にするパッケージはありますか?私は "Scratch From Data Science"の本を読んでおり、仮説検定と推論に固執している。Pythonで仮説検定を実行するには?

+0

[SciPyパッケージ](http://docs.scipy.org/doc/)には、[chi-square](http://docs.scipy.org/doc/scipy)のページがあります。 /reference/generated/scipy.stats.chisquare.html#scipy-stats-chisquare) – davedwards

+0

[浮動小数点の2つのリストのp値の計算方法](https://stackoverflow.com/questions/29561360/how-to -calculate-p-value-for-float)、[Python p-value from t-statistic](https://stackoverflow.com/questions/17559897/python-p-value-from-t)を参照してください。 -statistic)も役に立ちます/関連しています – davedwards

答えて

0

scipyのダウンロードパッケージには、仮説検定を含め、統計的なものがたくさんでモジュール全体を持っているとビルドに分布関数:たとえば、scipy.stats

、これはランダムなサンプルが正常にコルモゴロフを使用して配布される場合は、テストすることができますどのように-Smirnov試験:

import numpy as np 
from scipy.stats import norm, pareto, kstest 

n = 1000 
sample_norm = norm.rvs(size=1000) # generate normally distributed random sample 
sample_pareto = pareto.rvs(1.0, size=1000) # sample from some other distribution for comparison 

d_norm, p_norm = kstest(sample_norm, norm.cdf) # test if the sample_norm is distributed normally (correct hypothesis) 
d_pareto, p_pareto = kstest(sample_pareto, norm.cdf) # test if the sample_pareto is distributed normally (false hypothesis) 

print('Statistic values: %.4f, %.4f' % (d_norm, d_pareto)) 
print('P-values: %.4f, %.4f' % (p_norm, p_pareto)) 

あなたはkstest戻っ統計の値とp値を見ることができるように。 norm.cdfは、通常の確率変数の累積分布関数を表します。

+0

これは私が感謝のために探していたものです!ちょうどカップルが質問をフォローします。まず、提供したコードで、null仮説と代替仮説はどこで記述されていますか?そして、あなたはそれらの価値に価値を与えていますか? 'sample_norm'と 'sample_pareto'の値はランダムな値ですか? – rmahesh

+0

'sample_norm'と' sample_pareto'は、基本的に、正規分布とパレート分布からそれぞれサンプリングされた数字の配列です。この例では、 'sample_norm is not normally distributed 'に対して、与えられた2つの引数を指定して' kstest'関数を呼び出すことによって、sample_normが正常に分散されていないということについて、NULL仮定をテストします。あなたが見ることができるように、それは仮説のようなものではなく、コードのどこかで定義されていますが、代わりにコードによって暗示されています:) – Slippy

+0

パーフェクトありがとうございます!私はこれを行いP値を得る方法を探していましたが、これがそうであるようです! – rmahesh

関連する問題