私は加重平均からなる要約統計量の表をまとめてより良い、より速い方法を見つけようとしています。要約するためにdplyrを使用し、次にbind_rowsを使用して、私はこのような表になります。これらの数値は単純な平均です。平均は各グループの各要因について計算されます。加重スコアのdata.frameをより速く作成する方法はありますか?
DATAFRAME:au.scores
AU AUDIT CORC GOV PPS TMSC TRAIN
1 Group1 2.833333 2.000000 2.733333 2.000000 1.750000 2.333333
2 Group2 2.833333 0.000000 2.733333 2.000000 1.750000 2.333333
3 Group3 1.833333 2.533333 2.466667 2.000000 2.500000 2.166667
4 Group4 3.000000 2.733333 2.200000 2.666667 1.583333 2.666667
5 Group5 2.625000 1.816667 2.533333 2.166667 1.895833 2.375000
これに続い
I 3と各変数の要素とグループ1 & 2を組み合わせた加重スコアを導出する必要がある、4、5、すなわちOverall.Group1 Group1 + Group4 + Group5、Group2はGroup2 + Group4 + Group5、Group3はGroup3 + Group4 + Group5要因です。
group1.overall <- data.frame(
group1.gov = (au.scores[3, 4] * .30) * .33 + (au.scores[1, 4] * .30) * .33 +
(au.scores[2, 4] * .30) * .33,
group1.corc = (au.scores[3, 3] * .30) * .33 + (au.scores[1, 3] * .1) * .33 +
(au.scores[2, 3] * .1) * .33,
group1.tmsc = (au.scores[3, 6] * .30) * .33 + (au.scores[1, 6] * .30) * .33 +
(au.scores[2, 6] * .30) * .33,
group1.audit = (au.scores[3, 2] * .30) * .33 + (au.scores[1, 2] * .30) * .33 +
(au.scores[2, 2] * .30) * .33,
group1.pps = (au.scores[3, 5] * .30) * .33 + (au.scores[1, 5] * .30) * .33 +
(au.scores[2, 5] * .30) * .33,
group1.train = (au.scores[3, 7] * .30) * .33 + (au.scores[1, 7] * .30) * .33 +
(au.scores[2, 7] * .30) * .33
)
は
group1.gov group1.corc group1.tmsc group1.audit group1.pps group1.train
1 0.7854 0.3168 0.594 0.7425 0.594 0.6765
質問 は、全体的なスコアのdata.frameを作成するための迅速な方法があります生成しますか?
何かOverall.Group1はグループ1 + GROUP4 + GROUP5あるなど
あなたは 'data.table'を試しましたか?それはかなり速く(data.frameよりはるかに速い) –