2017-05-10 7 views
0

POSIXタイムスタンプ(ツイートデータセット)のリストがあります。特定の1週間の期間(金曜日の正午〜金曜日の正午)を選択して、現在のシステム時間(水曜日、16時など)と期間の終わりとの間に発行されたツイートを数えたいとします。特定の日付が指定されていないR内の時間

このコードは、現在の時刻が履歴よりも常に高いため、明らかに機能しません。

time.now=as.POSIXct(Sys.time()) 
sum(data$week==15 & data$time > time.now) 

開始し、金曜日の正午に終了し、唯一の時間と曜日を指定します日付に依存しない形式に私のデータを変換する方法はありますか?

ありがとうございます!

+1

申し訳ありませんが、あなたがしたいことは明確ではありません。日曜日の深夜の代わりに金曜日の正午に開始するように '週'を再定義しようとしていますか?そして、現在の日付から '週'の終わりまで、それぞれの新しい「週」を調べますか? 2週間にわたる簡単なサンプルデータは、適切な回答を得るのに本当に役立ちます。 – thelatemail

答えて

1

再現可能な例を提供していないので、できるだけ簡単に説明しようとします。あなたはあなたのデータセットの小さなセクションを追加する必要があります。

あなたはあなたの最初と最後の点は、最初の金曜日2017と金曜日の正午例えば:今週何であるかを定義することができます。

「私は特定の週、長い期間を選択したいです」。

は、その後、あなたが入れてカット使用することができます

f1 <- strptime("2017-01-06 12:00", format = "%Y-%m-%d %H:%M", tz = "UTC") # first Friday 2017 
f2 <- strptime("2017-05-12 12:00", format = "%Y-%m-%d %H:%M", tz = "UTC") # this week 

はその後

seq <- seq.POSIXt(f1, f2, by = "week") 

「現在のシステム時刻の間に公開されたどのように多くのツイート回数」金曜日

に金曜日からPOSIXtのシーケンスを生成しますつぶやき(あなたが金曜日から金曜日までにどれくらい得るかを数えます):

cut(dataset, breaks = seq, labels = 1:length(seq), right = TRUE) 

最後に、binでグループ化し、オカレンスをカウントする必要があります。 これはあなたが望むものですか?お役に立てれば。

関連する問題