いくつかの異なる平均の平均をとるにはどうしたらいいですか?あなたが見ることができるように、私は別のヶ月間の異なるサンプルサイズを持つ平均の平均 - 異なるサンプルサイズの平均を集計する方法
library(dplyr)
month <- c("January", "January","January", "February", "March", "April", "April", "May", "June", "July")
year <- c(2014, 2014, 2014, 2014, 2014, 2014, 2014, 2014, 2014, 2014)
v1 <- c(0, 1, 0, 1, 0, 0, 1, 0, 1, 1)
df <- data.frame(month, year, v1)
:ここ
は、いくつかのデータです。 1月のサンプルサイズは、私は毎月の平均を得て、それらのそれぞれの平均値を取ることができなど、4月のサンプルサイズは2、3:
df %>% group_by(year, month) %>% summarize_all(mean)
しかし、どのように私はを得るのですか正確なは、私が数ヶ月の平均を持っていることを考えると、2014年を意味します。
これは統計的な質問ですか?各行があなたのデータに現れるサンプルであると仮定すると 'group_by(year)'だけです。代わりに、あなたは 'weighted.mean()'を使うことができます – ssp3nc3r
はい、私は統計的な質問であると思います。毎月の平均が異なるサンプルサイズで作成されていることを前提とすると、何らかの重み付けが必要なのかどうかはわかりません。 –
クロスバリデーションに投稿することで、統計的な質問に役立つ可能性がより高くなります。https://stats.stackexchange.com – ssp3nc3r