2017-09-10 12 views
1

私はPythonでpandasライブラリを使っています。私は次のように正規分布から引き出される4無作為標本があるとします。複数の信頼区間

np.random.seed(12345) 

df = pd.DataFrame([np.random.normal(32000,20000,3650), 
        np.random.normal(43000,10000,3650), 
        np.random.normal(43500,14000,3650), 
        np.random.normal(48000,7000,3650)], 
        index=[1992,1993,1994,1995]) 

私はこれらのサンプルのそれぞれについて、95%信頼区間を取得したいので、私は計算:

mean_value=df.mean(axis=1) 
std_value=df.std(axis=1,ddof=0) 
lower_bound=mean_value-1.96*std_value 
upper_bound=mean_value+1.96*std_value 
diff = upper_bound-lower_bound 

各信頼区間について、私は11等分間隔でそれをカットしたい。

これは、カット間隔が信頼区間の上端で終わらないため、うまくいきません。どのようにして等間隔の間隔を得ることができますか?

+2

私が編集した(https://stackoverflow.com/questions/15033511/compute-a-confidence-interval-from-sample-data)[サンプルデータから信頼区間を計算] – MaxU

+0

の可能性のある重複オーバーラップを取り除くための質問。 – user21359

答えて

2

あなたが望むものは正確にはわかりませんが、NumPyのlinspace関数で等間隔にするのは簡単です。ここには最初の分布の11の区間があります。

np.linspace(lower_bound.values[0], upper_bound.values[0], 12) 
array([ -7.18705879e+03, -3.82825067e+01, 7.11049377e+03, 
     1.42592701e+04, 2.14080463e+04, 2.85568226e+04, 
     3.57055989e+04, 4.28543752e+04, 5.00031514e+04, 
     5.71519277e+04, 6.43007040e+04, 7.14494803e+04]) 
関連する問題