免責事項 - タイトルが誤解を招く可能性があります - 解決策が見つからなかった理由の一部は、Googleに何が正確にわからないということです。複数のグループを使用して変数を追加する
私は拡張されたフォーマットでグループレベルのデータセットを持っています。年と国コードなど(手入力)以下のように各グループ(ID)に対して繰り返さ
year country id v1 v2 v3
1991 20 1 1 0 0
1991 20 2 0 1 0
1991 20 3 0 0 1
1991 20 4 1 0 0
1991 20 5 1 0 0
1991 20 6 0 1 0
私はそれが次
year country id v1 v2 v3 v1.count v2.count v3.count
1991 20 1 1 0 0 3 2 1
1991 20 2 0 1 0 3 2 1
1991 20 3 0 0 1 3 2 1
1991 20 4 1 0 0 3 2 1
1991 20 5 1 0 0 3 2 1
1991 20 6 0 1 0 3 2 1
のようになりますので、最後に列として国年のカウントを追加します
私はaggregate
、count
、およびdplyr
を試してみました。私はGroup by and conditionally countまたはFrequency count for a specific categoryがトリックをするかもしれないと思ったが、うまく動作しなかった。どうすればこれを達成できますか?
'df $ v1.count < - sum(df $ v1)'? – 989
それは 'df'のすべての年と国で' v1'を集計しますか?いいえ? – rfsrc