私はRのスキルに取り組んでいます。可能であれば、dplyr
パッケージを使用してこの問題を解決したいと思います。グループ平均を計算し、グループに基づいて遅れをとります。
私はファンタジーフットボール統計のデータセットを持っています。各記録は、その週にプレイしたファンタジーのサッカーポイントを含め、シーズンの1試合(週)のプレーヤーの統計です。ここで
は、私が働いているデータの抜粋です:
Player Week year Fantasy.Points Avg.Fantasy.Ponts
1 Aaron Hernandez 1 2011 16.3 9.678571
2 Aaron Hernandez 2 2011 12.2 9.678571
3 Aaron Hernandez 5 2011 5.6 9.678571
4 Aaron Hernandez 6 2011 10.8 9.678571
5 Aaron Hernandez 8 2011 7.1 9.678571
6 Aaron Hernandez 9 2011 9.5 9.678571
7 Aaron Hernandez 10 2011 4.1 9.678571
8 Aaron Hernandez 11 2011 4.4 9.678571
9 Aaron Hernandez 12 2011 6.2 9.678571
10 Aaron Hernandez 13 2011 4.3 9.678571
11 Aaron Hernandez 14 2011 8.4 9.678571
12 Aaron Hernandez 15 2011 20.5 9.678571
13 Aaron Hernandez 16 2011 3.7 9.678571
14 Aaron Hernandez 17 2011 22.4 9.678571
15 Aaron Hernandez 1 2012 12.4 8.755556
16 Aaron Hernandez 6 2012 9.0 8.755556
17 Aaron Hernandez 7 2012 5.4 8.755556
18 Aaron Hernandez 12 2012 3.6 8.755556
19 Aaron Hernandez 13 2012 9.7 8.755556
20 Aaron Hernandez 14 2012 17.8 8.755556
フィールドAvg.Fantasy.Points
プレイヤーがそのレコードに年間価値があった点の平均数です。たとえば、Aaron Hernandezは、2011年シーズンに平均9.678571ポイント、2012シーズンに8.755556ポイントの価値があった。
私は、プレーヤーが前年のの価値があった平均ポイント数の列を計算することに興味があります。上記の例では、2012年のAaron Hernandezの記録は、前年の平均が9.68571ポイントであることを示す必要があります。