2017-04-07 21 views
0

私はオレゴン州のキャンペーン貢献データを使用していますが、候補者あたりの累積寄付額を時間とともにグラフ表示しようとしています。ここで私がこれまで持っているものです。時間の経過とともにcumsumのデータが増加する

ggplot(aes(x = as.Date(contb_receipt_dt, "%d-%b-%y"), 
      y = cumsum(contb_receipt_amt)), 
      data = subset(oregon_data, 
         table(oregon_data$cand_nm)[oregon_data$cand_nm] > 1000       
          & as.Date(contb_receipt_dt, "%d-%b-%y") > as.Date("2015-01-01"))) 
+ geom_line(aes(color = cand_nm), bins = 5) 

これは、それがどのように見えるかです:

failed graph

私が見たいのは何が0でオフに始まり、ゆっくりと行く、各候補者のためのラインでありますそれぞれの追加貢献と一緒に。私は何をすべきか?

+0

ありますか?あなたはURLを持っていますか、または小さなサンプルを投稿できますか? –

+0

私はこのURLでオレゴンのデータを使用しています:http://fec.gov/disclosurep/PDownload.do – Bryanzpope

答えて

0

gplyplusに送信する前に、cumulative列を計算するのにdplyrを使用します。これは、しかし、あなたが探している結果を得るためにはかなりそれがアップして、データをフィルタリングする必要があるでしょう、あなたが十分sarted取得する与える必要があります:オープンデータこのデータ

WashingtonData <- read.csv("P00000001-WA.csv") 
WashingtonData <- WashingtonData %>% arrange(contb_receipt_dt) 

MyGraphData <- WashingtonData %>% group_by(cand_nm) %>% mutate(cumsum = cumsum(contb_receipt_amt)) 

g <- ggplot(data=MyGraphData, aes(y=cumsum, x=contb_receipt_dt, color=cand_nm)) + geom_line() 
g 
関連する問題