2016-08-31 3 views
0

私はイベントデータセットを扱っており、特定の条件に基づいて特定の変数を合計して新しいdfを作成するのに役立つ必要があります。複数の行から1行に集約するdfを作成する

たとえば、郡に販売されているすべての車のデータセットをディーラーの名前、車の販売月、自動車の販売年、過去の販売台数n年。私は新しい行を作成したいと思います。ここで、各行は、特定のディーラーによって年間販売された車の数を表示します。言い換えれば

が、私はこのようなものから、行きたい:

Dealership Month Year # of Cars 
Bobs   ?  2016 32 
Toms   ?  2016 12 
... 

Dealership Month Year # of Cars 
Bobs   April 2016 12 
Toms   March 2016 8 
Bobs   July  2016 20 
Toms   June  2016 4 
... 

私は月のデータので、それは私にエラーを与えるのかはわからない(またはより大きいデータセットの他の列)は異なります。私はその情報を必要としません。

誰でも手助けできますか?どうもありがとう。

+1

で覆われています。あなたは「それが私にエラーを与えるかどうかはわかりません...」と言います。それを試して、あなたのコードとその結果を投稿してください。我々はMCVEが必要です:http://stackoverflow.com/help/mcve –

答えて

1

我々は唯一の再現可能な例なしでそんなにを行うことができますが、これはおそらく、我々はより多くを見る必要がdplyr

library(dplyr) 
yourdata %>% group_by(Dealership, Year) %>% summarise(Ncars = sum(`# of Cars`)) 
+0

こんにちはジョナサン。ありがとうございました。私が使用しているデータセットはです。これは、武力紛争に関するイベントデータであり、武力紛争の暴力事件(日時まで)を特定するためにメディアの報告を使用しています。私がデータセットに最も興味を持っている主な変数は、conflict_new_id(ディーラーシップ)、deaths_civilians(自動車の数)、およびyear(Year)です。 1989〜2014年の間に各交戦国には何千もの行があります。私はそれが再現可能な例ではないことをお詫びしますが、私はこれにかなり新しいです。どんな助けでも大歓迎です。 – user6780841

関連する問題