0
私はPrestoとZeppelinを使用しています。生データがたくさんあります。 私はこれらのデータを要約する必要があります。Prestoを使用して時間列を5秒間隔でグループ化し、列をカウントするにはどうすればよいですか?
私は5秒ごとに時間をグループ化したいと思っています。
serviceType logType date
------------------------------------------------------
service1 log1 2017-10-24 23:00:23.206
service1 log1 2017-10-24 23:00:23.207
service1 log1 2017-10-24 23:00:25.206
service2 log1 2017-10-24 23:00:24.206
service1 log2 2017-10-24 23:00:27.206
service1 log2 2017-10-24 23:00:29.302
その結果
serviceType logType date cnt
--------------------------------------------------------------
service1 log1 2017-10-24 23:00:20 2
service2 log1 2017-10-24 23:00:20 1
service1 log1 2017-10-24 23:00:25 1
service1 log2 2017-10-24 23:00:25 2
最初、私は新しいテーブルに保存された件のデータを移行する必要があります。
2番目に、データをグループ化して新しいテーブルにリアルタイムで保存する必要があります。
sqlスクリプトを書くのは難しいです。
私を助けてください。
私はPythonインタープリタを使用する必要がありますか?