spread
私は、このデータを以下の(最初の12行はここに示しています)列「年」で、国の名前'。その後、2015年R:広げる方法、グループ化する、要約する、突然変異させる方法
CountryName Days pCountry Revenue Orders Year
United Kingdom 0-1 days India 2604.799 13 2014
Norway 8-14 days Australia 5631.123 9 2015
US 31-45 days UAE 970.8324 2 2014
United Kingdom 4-7 days Austria 94.3814 1 2015
Norway 8-14 days Slovenia 939.8392 3 2014
South Korea 46-60 days Germany 1959.4199 15 2014
UK 8-14 days Poland 1394.9096 6. 2015
UK 61-90 days Lithuania -170.8035 -1 2015
US 8-14 days Belize 1687.68 5 2014
Australia 46-60 days Chile 888.72 2. 0 2014
US 15-30 days Turkey 2320.7355 8 2014
Australia 0-1 days Hong Kong 672.1099 2 2015
から2014から各「COUNTRYNAME」の「受注」の%変化を計算し、私は小さなテストデータフレームでこの作業を行うことができますが、唯一の「合計意味がないような無限のエラーを返すように見えることができます因子のための "または"行のための重複した識別子 "と完全なデータ。 dplyrのドキュメントを読んでから、私があきらめたことを試してみた。誰もこのコードで助けることができます...
data %>%
spread(Year, Orders) %>%
group_by(CountryName) %>%
summarise_all(.funs=c(Sum='sum'), na.rm=TRUE) %>%
mutate(percent_inc=100*((`2014_Sum`-`2015_Sum`)/`2014_Sum`))
期待される出力は以下のような表になります。 (注:これらの数字は例示するためのものであり、彼らは計算されていない手)
CountryName percent_inc
UK 34.2
US 28.2
Norway 36.1
... ...
編集
私は、変数名にいくつかの編集をしなければならなかったので、予めご了承ください。
サンプルデータを提供してください'dput'と期待通りの結果を使用して – HubertL