2016-07-28 7 views
1

年にFatalitiesのグラフをプロットする必要がありました。だから私は 年をDateから取り出してグループ分けし、それから私は 年に致命者を得るように要約しました。しかし、それを実行すると、データセット全体に致命的なものが与えられます。Rの[DPLYR Package]のGroup_byとSummarize関数に関する誤解

なぜわかりませんか?年に一度致命的な犠牲者を得るための代替手段。

データセットでは、致命的事態が発生し、毎年多くの事故が発生しました。

crash_data=read.csv("https://raw.githubusercontent.com/gluque/analytics_task2/master/Airplane_Crashes_and_Fatalities_Since_1908.csv") 
    > crash_data$Date <- as.Date(crash_data$Date, "%m/%d/%Y") 
    > crash_data$Date <- format(crash_data$Date, '%Y') 
    > cd<-subset(crash_data,select = c(Fatalities,Date)) 
    > ab<-group_by(cd,Date) 
    > ef<-summarize(ab,Fatalities=sum(Fatalities,na.rm = TRUE)) 
    > ef 
     Fatalities 
    1  105479 
+0

'GROUP_BYを試してみてください(CD、日付)私が試し%>%のsummarize(死者数=合計(死亡者数、na.rm = TRUE)' – theArun

+0

@theArun。これは、同じ結果が得られました。 –

答えて

0
> group_by(cd,Date) %>% summarize(Fatalities = sum(Fatalities, na.rm = TRUE)) 
# # A tibble: 98 x 2 
#  Date Fatalities 
#  <chr>  <int> 
# 1 1908   1 
# 2 1912   5 
# 3 1913   45 
# 4 1915   40 
# 5 1916  108 
# 6 1917  124 
# 7 1918   65 
# 8 1919   5 
# 9 1920   24 
# 10 1921   68 
# ... with 88 more rows 
関連する問題