2
私はPythonでSciPyを使用して、次何らかの理由nan
値返しています:SciPyは、分散が0のサンプルでt検定のために `nan`を返すのはなぜですか?
>>>stats.ttest_ind([1, 1], [1, 1])
Ttest_indResult(statistic=nan, pvalue=nan)
>>>stats.ttest_ind([1, 1], [1, 1, 1])
Ttest_indResult(statistic=nan, pvalue=nan).
をしかし、私は別の要約統計量を持っているサンプルを使用するたびに、私は実際に妥当な値を取得:
stats.ttest_ind([1, 1], [1, 1, 1, 2])
Ttest_indResult(statistic=-0.66666666666666663, pvalue=0.54146973927558495).
を
nan
のp値を代わりに0
と解釈することは妥当ですか?統計から、同じサマリー統計を持つサンプルに対して2サンプルのt検定を実行することは意味がありませんか?
私は問題は、ttestsには標準偏差による除算が含まれていると思います。私は代わりに標準偏差が0であるかどうかを調べるでしょう。なぜなら、それがナノを返す他のケースがあるかもしれないからです(彼らが何であろうと確信していません)。 –