ログファイルは、1つの列の日付ともう1つの列の時刻だけです。私は最も人気のある時間帯を見つけようとしています。最も時間のかかるグループをグループ化して識別する
Date Time
Jan/01/2017 08:23:45
Jan/01/2017 15:54:21
Jan/02/2017 04:02:39
Jan/03/2017 06:33:12
...
データを10分の部分にグループ化し、最も一般的な1時間間隔を見つける効率的な方法を探しています。
Interval Count
08:10:00 - 09:10:00 586
08:20:00 - 09:20:00 565
08:30:00 - 09:30:00 544
...
これは、データのGBにもスケールアップしていると私は並べ替えずに、好ましくは、最も人気のある区間を見つけることができるようにする必要があります。だから、最も人気のある1時間のインターバルのような連続しただろう可能性が高いですテーブル全体。