2016-08-02 11 views
0

私は二項分布に従う観測値を持つ4つの異なるデータフレームを得ており、それぞれについて第2列の平均値(Flow)を計算する必要があります。 。平均二項分布の信頼区間R

成功数は、Successtotal number of trials = 85の欄に報告されています。

信頼区間をどのように計算できますか? Rでどうすればいいですか?ここで

私data.framesの例:

df1 <- read.table(text = 'Flow Success 
725.661 4 
25.54  4 
318.481 4 
230.556 4 
2.823  3 
12.6  3 
9.891  3 
11.553 1', header = TRUE) 

> mean(df1$Flow) 
[1] 167.1381 


df2 <- read.table(text = 'Flow Success 
725.661 3 
25.54  3 
318.481 3 
230.556 2 
2.823  2 
12.6  1', header = TRUE) 

> mean(df2$Flow) 
[1] 219.2768 

df3 <- read.table(text = 'Flow Success 
725.661  2 
25.54  2 
318.481  1', header = TRUE) 

> mean(df3$Flow) 
[1] 356.5607 

df4 <- read.table(text = 'Flow Success 
725.661 2 
25.54  2', header = TRUE) 

> mean(df4$Flow) 
[1] 375.6005 

私は上記の手段の信頼区間を計算する必要があります。

必要に応じてデータに関する詳細をお知らせします。

私を助けてくれる人に感謝します。

+2

あなたの観測値は整数でない場合、どのように二項分布に従うことができますか? – lmo

+0

各観測値は整数値を持つ第2列に接続されています。コメントをいただきありがとうございます。 –

+2

@ user6644063「第2列に接続しました」とはどういう意味ですか?何回観測していますか?あなたがデータを提示した方法は非常に混乱しています。 –

答えて

0

パッケージbinomは、2項の信頼区間を計算する方法を提供します。使用可能なすべてのメソッドを使用するか、または単一のメソッドを指定するかを選択できます。

x成功回数を示し、nベルヌーリ試行回数を示す。

library(binom) 

binom.confint(x = 5, n = 10) 
      method x n mean  lower  upper 
1 agresti-coull 5 10 0.5 0.2365931 0.7634069 
2  asymptotic 5 10 0.5 0.1901025 0.8098975 
3   bayes 5 10 0.5 0.2235287 0.7764713 
4  cloglog 5 10 0.5 0.1836056 0.7531741 
5   exact 5 10 0.5 0.1870860 0.8129140 
6   logit 5 10 0.5 0.2245073 0.7754927 
7   probit 5 10 0.5 0.2186390 0.7813610 
8  profile 5 10 0.5 0.2176597 0.7823403 
9   lrt 5 10 0.5 0.2176212 0.7823788 
10  prop.test 5 10 0.5 0.2365931 0.7634069 
11  wilson 5 10 0.5 0.2365931 0.7634069 

binom.confint(x = 5, n = 10, method = "exact") 
    method x n mean lower upper 
1 exact 5 10 0.5 0.187086 0.812914 
+0

私はすでにbinomパッケージを知っていて使いました。しかし、それが手段のCIを計算する最良の方法だと思いますか? –

+0

私はそれが二項データのためだと思います。私はあなたが傍受専用glmに合っていて出力を大きくすることができると思うが、それは不必要に複雑に思える。 質問の例でデータがどのように構造化されているかわかりません。 Imoへのあなたのコメントは、各観測に2番目の列、つまり整数があると述べています。それが裁判や成功の数を指しているかどうかは明らかではありません。それでも両方必要です。 –

+0

謝罪は私の質問ではあまり明確ではないが、これは私がまだよく理解する必要がある(したがって私の質問)ものです。 2番目の列は成功回数を示します。 2番目の列を最初に考慮して後で乗算するか、(1番目の列で得られた)相対的な方法でそれらを加算することによってCIを計算する必要がありますか? ...私は私の質問を更新する –

関連する問題