私はカイ2乗計算を自動化しようとしています。私はscipy.stats.pearsonr
を使用しています。しかし、これは私にSPSSとは異なる答えを与えています。同様に、10の差の要因。 (.07 - > .8)SPSSの結果と異なるscipyでカイ二乗
両方のケースで(pandas.crosstabを使用して)クロスタブを印刷しているので、数字が同じであるため、両方のデータが同じであることは間違いありません。
d1 = [1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1, 1, 0, 0, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 0, 0, 1, 0, 0, 1, 1, 1, 1, 1, 0, 1, 1, 0, 0, 1, 1, 1, 0, 1, 0, 1]
d2 = [1, 0, 0, 0, 1, 1, 1, 0, 1, 0, 1, 1, 2, 1, 1, 1, 1, 1, 2, 1, 1, 1, 1, 1, 2, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 0, 0, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 0, 1, 2, 1, 0, 1, 1, 2, 0, 2, 1, 2, 0, 0, 1]
print scipy.stats.stats.pearsonr(d1,d2)
が与える:
(-0.065191159985573108, 0.61172152831874682)
(第一の係数であり、第二は、p値である)
をしかし、SPSSは、ピアソンカイ二乗は0.057であることを述べています。
クロス集計以外のチェックが必要なことはありますか?
対応するSPSSコードも表示できますか? –
他の誰かがSPSSを作ったので、簡単に出力にアクセスできます... –