1
は私がすべての数値とint型の列の平均値を計算したい フィルタリングNA値は
$ Lead.Score : int 105 120 150 60 80 0 80 0 80 145
$ Average.Time.Per.Visit : num 0 83.8 4 0 0 ...
$ TotalVisits : int 0 5 2 1 2 0 2 0 2 4 ...
$ Page.Views.Per.Visit : num 0 2.5 2 1 1 0 2 0 2 4 ...
$ Average.Time.Per.Visit.1 : num 0 83.8 4 0 0 ...
$ Last.Activity : chr "Page Visited on Website" "Email
$ Last.Activity.Date : POSIXct, format: NA NA ...
$ First.Landing.Page.Submission.Date: POSIXct, format: NA NA ...
$ Created.On : POSIXct, format: "2016-07-31 17:11:00"
の下のようなデータフレーム構造を有していることを意味します。どのようにdplyrでそれを行うには?
私はこの
train_webdata %>%
select(which(sapply(., is.numeric))) %>%
group_by(Lead.Stage) %>%
summarise_each(funs(mean,na.rm=TRUE))
のような何かをした。しかし、それは動作しません。
dplyrで 'select_if'機能は今もあり、後
select
操作を行うことができます。 – aosmith