私はPython 3.6を使ってデータセットの統計テストを行っています。私が達成しようとしているのは、で、統計的有意性を決定するためにデータセットとトレンドラインの間でt検定を実行することです。私はこれを行うためにscipyを使用していますが、必要な結果を得るためにテストにどの変数を含めるべきかわかりません。 Python:Statistics T-test
はここで、これまでに私のコードです:import numpy as np
import matplotlib.pyplot as plt
from scipy import stats
p = np.load('data.npy')
#0=1901
start=0
end=100
plt.figure()
plt.plot(a,annualmean, '-')
slope, intercept, r_value, p_value, std_err = stats.linregress(a,annualmean)
plt.plot(a,intercept+slope*a, 'r')
annualmean=[]
for n in range(start,end):
annualmean.append(np.nanmean(p[n]))
#Trendline Plots
a=range(start,end)
year1 = 1901
print(stats.ttest_ind(annualmean,a))
今のコードが動作している、エラーメッセージなし、しかし、私は私が正しいとは思わない、信じられないほど小さなp値を取得しています。もし誰かが知っているのであれば、私はt検定に書くべき変数を知っています。それは非常に役に立つでしょう。 ありがとう!
注2つのアレイを持っている必要はありませんttest_indの長さ。 docstringのexcept節を参照してください。 – user333700