2017-04-06 8 views
0

私は以下のコードと時間によって私はグループに私のデータをしようとしていますR、に私のデータを読みました:私はこのコードを実行すると、私は私が私を取得することはできません(下記参照)のエラーを取得時間単位でデータをグループ化するにはどうすればよいですか?

tweets <- read.csv("tweetCSV.csv", header = TRUE, sep = ",", stringsAsFactors = FALSE) 

tweets %>% 
group_by(format(Time, "%H"), Word) %>% 
summarise(count=n()) 

頭周り:

  • "エラーをmutate_implに(.dataセクション、ドット):無効な引数 'トリム'"

誰もが、私はこの問題を克服することができます場合、私は思っていましたの?データ・セットの

おかげでジェームズ

サンプルは、このリンクを介してアクセス可能である:https://docs.google.com/spreadsheets/d/1JhXEyzkjPs59hVgoS3lW7e0Fcumis62QDUvuMP2q5aQ/edit?usp=sharing

答えて

2

は、これが私の仕事:POSIXctに変換

tweets %>% 
    mutate(Time = as.POSIXct(Time)) %>% 
    group_by(lubridate::hour(Time), Word) %>% 
    summarise(count=n()) %>% 
    arrange(desc(count)) 

あなたはlubridateの時間関数を使用することができますそれは便利です。

+0

ありがとうございます、本当に助けに感謝します:-)私はこれを動作させるために年齢を過ごしてきました。 @Adrian Martin私は、あなたが潤滑剤でdplyrを使用することについてもっと学ぶための良い情報源を知っているのだろうかと思っていましたか? – jr134

+0

私はそれらを別々に学びました。 dplyrで快適になるには少し時間がかかります。 Lubridateは非常に簡単に学ぶことができます。すべてのクラスが何であるかを把握するために、常にデータの "str()"を呼び出します。 dplyrのRStudioチートシートを使用することをお勧めします。https://www.rstudio.com/resources/cheatsheets/です。 –

関連する問題