-1
私は1時間間隔で平均で一日の最も忙しい時間を見つけるようにリクエストしたいと思います。Spark Request with time
"%d /%b /%Y:%H:%M:%S"形式でデータフレームに行の日付があります。
私はそのように始まる:
mostBusyTimeDF = logDF.groupBy("date") ...
たとえば入力の場合:
date
2015-12-01 21:04:00
2015-12-01 10:04:00
2015-12-01 21:07:00
2015-12-01 21:34:00
出力では:私は知りませんした後
date count(1 hour interval)
2015-12-01 21:04:00 3
2015-12-01 10:04:00 1
私はそれをどのように行うことができます。..
私を助けることができますか?あなたが使用することができます
どうもありがとう
あなたは私たちにサンプル入力と出力を提供することはできますか?たとえば、1 AM - 10の要求、2 AM - 20の要求などを作成しますか? –
@T.Gawęda私は質問 – JackR
を編集するのは、指定された時間の最初の日付のみであるべきですか? –