P値を見つけるのが理想的です。私はより多くの統計の背景から来て、かなり新しいPythonです。私にこれを可能にするパッケージはありますか?私は "Scratch From Data Science"の本を読んでおり、仮説検定と推論に固執している。Pythonで仮説検定を実行するには?
答えて
scipyのダウンロードパッケージには、仮説検定を含め、統計的なものがたくさんでモジュール全体を持っているとビルドに分布関数:たとえば、scipy.stats
、これはランダムなサンプルが正常にコルモゴロフを使用して配布される場合は、テストすることができますどのように-Smirnov試験:
import numpy as np
from scipy.stats import norm, pareto, kstest
n = 1000
sample_norm = norm.rvs(size=1000) # generate normally distributed random sample
sample_pareto = pareto.rvs(1.0, size=1000) # sample from some other distribution for comparison
d_norm, p_norm = kstest(sample_norm, norm.cdf) # test if the sample_norm is distributed normally (correct hypothesis)
d_pareto, p_pareto = kstest(sample_pareto, norm.cdf) # test if the sample_pareto is distributed normally (false hypothesis)
print('Statistic values: %.4f, %.4f' % (d_norm, d_pareto))
print('P-values: %.4f, %.4f' % (p_norm, p_pareto))
あなたはkstest
戻っ統計の値とp値を見ることができるように。 norm.cdf
は、通常の確率変数の累積分布関数を表します。
これは私が感謝のために探していたものです!ちょうどカップルが質問をフォローします。まず、提供したコードで、null仮説と代替仮説はどこで記述されていますか?そして、あなたはそれらの価値に価値を与えていますか? 'sample_norm'と 'sample_pareto'の値はランダムな値ですか? – rmahesh
'sample_norm'と' sample_pareto'は、基本的に、正規分布とパレート分布からそれぞれサンプリングされた数字の配列です。この例では、 'sample_norm is not normally distributed 'に対して、与えられた2つの引数を指定して' kstest'関数を呼び出すことによって、sample_normが正常に分散されていないということについて、NULL仮定をテストします。あなたが見ることができるように、それは仮説のようなものではなく、コードのどこかで定義されていますが、代わりにコードによって暗示されています:) – Slippy
パーフェクトありがとうございます!私はこれを行いP値を得る方法を探していましたが、これがそうであるようです! – rmahesh
- 1. R:パネルデータの仮説検定
- 2. 仮説検定のタイプIIエラー
- 3. Pythonの仮説互いに
- 4. Python仮想環境を起動し、プロジェクトディレクトリで仮想Pythonを実行するバッチ
- 5. 仮説を使用したPythonテスト
- 6. Pythonでカイ二乗検定を実行する
- 7. のStata:t検定0に等しくない平均差で帰無仮説で
- 8. 手段のtimeit()と仮説検定の使用
- 9. 普通の母集団について仮説検定を行うためのクラスが必要です
- 10. 仮想マシンで実行するタイミングを決定する
- 11. 仮説を有意にテストする
- 12. とにかく仮想ボックスでKinectを実行するには?
- 13. python - アプリケーションを仮想ファイルシステムから実行する
- 14. 仮想環境で入力argumantでPythonを実行
- 15. 仮説的な行動を仮定して将来の状態を計算する
- 16. RaspbianでPythonで実行可能ファイルを実行するには?
- 17. Pythonでleetを実行するには?
- 18. Pythonで 'ホットフォルダ'を実行するには?
- 19. 私はcobb-douglas関数のための一定の等間隔戻りの仮説検定をテストします:
- 20. 利用可能なPythonインタプリタのテストのみを実行するpython toxを説得するには?
- 21. Python - 標準誤差で見積もりのt検定を実行する
- 22. バックグラウンドで実行可能なpythonスクリプトを実行するには
- 23. Pythonを使用して仮想環境内でコマンドを実行する方法
- 24. Virtual Machine Manager - 実行時間別に仮想マシンを検索する
- 25. データフレームのt検定を実行するループを書くには?
- 26. coqの帰納仮説を
- 27. 仮想環境内のUbuntu 16.04でPythonプログラムをサービスとして実行する
- 28. 仮説検定に基づいて2つの曲線を比較する方法
- 29. データベース内の特定の行でgrep検索を実行する
- 30. 決定木からの仮説の数は?
[SciPyパッケージ](http://docs.scipy.org/doc/)には、[chi-square](http://docs.scipy.org/doc/scipy)のページがあります。 /reference/generated/scipy.stats.chisquare.html#scipy-stats-chisquare) – davedwards
[浮動小数点の2つのリストのp値の計算方法](https://stackoverflow.com/questions/29561360/how-to -calculate-p-value-for-float)、[Python p-value from t-statistic](https://stackoverflow.com/questions/17559897/python-p-value-from-t)を参照してください。 -statistic)も役に立ちます/関連しています – davedwards