2016-12-05 3 views
3

ブートストラップを使用して、リプレイス用の息子(np.random.choice)を1000回複製しようとしています。各レプリケーションの平均を計算することができます。そしてこれらの平均値の標準偏差を標準と比較することによって決定される。ブートストラップの使用random.choice

しかし、その部分を修正するには、ブートストラップ部分を正しく取得しないでください。

import numpy as np 
import pandas as pd 
from matplotlib import pyplot as plt 
import seaborn as sns 
from scipy import stats 

df = pd.read_csv('http://www.math.uah.edu/stat/data/Pearson.txt', 
       delim_whitespace=True) 
df.head() 
y = df['Son'].values 

Replications = np.random.choice(y, 1000, replace = True) 
print("Replications: " , Replications) 
print("") 
Mean = np.mean(Replications) 

print("Mean: " , Mean) 

sem = stats.sem(y) 
print ("The SEM : ", sem) 
+0

あなたは 'Replications = np.array([np.random.choice(df.Son、len(df)、replace = True)_ in(10000)])')を探していますか? – Abdou

+0

'np.mean(Replications、axis = 1)'? – Abdou

+0

私が探していたことをありがとう、私は間違って10000 1つを追加したと思いますか? –

答えて

2

次のように、長さ​​それぞれの1000の複製を作成することができます。

Replications = np.array([np.random.choice(df.Son, len(df), replace = True) for _ in range(1000)]) 
Mean = np.mean(Replications, axis=1) 
print("Mean: " , Mean) 

感謝を!

関連する問題