以下に示すように、私は、このような予想されると、各カテゴリ内の周波数を有する返します「Tはそう思う:stats.chisquareが誤っp_valueの= 0
stats.chisquare(city_ans.answered, city_ans.sent)
# Power_divergenceResult(statistic=893005.32003277098, pvalue=0.0)
フィルタリングがあまり変化しない10未満の値:
stats.chisquare(city_ans[city_ans.answered > 10].answered, city_ans[city_ans.answered > 10].sent)
# Power_divergenceResult(statistic=892917.3023088905, pvalue=0.0)
私は間違っていますか? ここでFテストをどうやって適用できますか?
PS。 OBSとEXPと同じ値で、この試験を用いて - そのようなコードはまた、1 = p_val返す必要があり、それはないただし= 1
stats.chisquare(city_ans.sent, city_ans.sent)
# Power_divergenceResult(statistic=0.0, pvalue=1.0)
p_val返す:
stats.chisquare(0.9*city_ans.sent, city_ans.sent)
# Power_divergenceResult(statistic=10591.249999999995, pvalue=0.0)
UPD:
f_obs = weeks_ans.answered/np.sum(weeks_ans.answered)
f_exp = weeks_ans.sent/np.sum(weeks_ans.sent)
stats.chisquare(f_obs, f_exp)
# Power_divergenceResult(statistic=0.064491479990141154, pvalue=1.0)
これはかなり良い結果に見えますが、私はここに何かがないと思います。
例えば以下のもの分布に見て、同じアプローチ:
# Power_divergenceResult(statistic=0.064491479990141154, pvalue=1.0)
はそれが公正disturbitionが同じ
が
データの量はどれくらいですか? –
@WarrenWeckesserわずか54カテゴリ(x軸)、頻度 - 非常に低い値から最大1000まで – Rocketq
大きなスパイクは同じx値で発生しますか?そうでない場合、それらは周波数において巨大な不一致を生じる。 –