私のデータフレームは、州名、年、および各年および各州の税額控除の3つの列で構成されています。以下は1つの状態の例です。dplyrを使用して遅れの差を計算する
year RealTaxRevs
1 1971 8335046
2 1972 9624026
3 1973 10498935
4 1974 10052305
5 1975 8708381
6 1976 8911262
7 1977 10759032
各州ごとに1年間の税収の変更を計算したいと思います。私は次のコードを使用しました:
data %>% group_by(state) %>% summarise(diff(RealTaxRevs, lag = 1, differences = 1))
しかし、それは私に "エラー:1つの値を期待して"与えます。
誰でもこのエラーメッセージを説明し、dplyrを使用して正しくこれを行うのに役立つでしょうか?ありがとうございました。
「要約」ではなく「変異」が必要なようです。また、 'diff'は長さnのベクトルが与えられたときに長さn-1のベクトルを返すので、最初の値として' NA'を追加する必要があります。したがって、コードは 'mutate(c(NA、diff(RealTaxRevs)))'となります。デフォルトでは1になっているので、 'lag'や' differences'を指定する必要はありません。 – eipi10
@ eipi10これは完全に機能します。ありがとうございました :)。 – tnabdb