2017-08-07 3 views
0

5分ごとにuv、pv、ipを分析し、Mysqlを格納する方法。pv、uv、ipを5分ごとに分析するスパークを使用する方法

Message sent: {"cookie":"a95f22eabc4fd4b580c011a3161a9d9d","ip":"125.119.144.252","event_time":"2017-08-07 10:50:16"} 
Message sent: {"cookie":"6b67c8c700427dee7552f81f3228c927","ip":"202.109.201.181","event_time":"2017-08-07 10:50:26"} 

それはちょうど00のようなものです::00-00:05 00:05--00:10というように、 私が使用:データは次の形式でカフカからである

val write=new JDBCSink() 
     val query=counts.writeStream.foreach(write).outputMode("complete") 
      .trigger(ProcessingTime("5 minutes"))  
      .start() 

が、私が00:01にコミットするか、それが故障すると、どうすれば00:01-00:06のように分析されないのでしょうか。

答えて

0

window機能の使用:

query = counts.groupBy(window('event_time', '5 second')).agg() 
query.writeStream.start() 
+0

PVを、紫外線計算が最後の日である、と私は、このウィンドウのように($ "UNIX_TIMESTAMP"、 "1日"、「5分のウィンドウを使用している場合、ウィンドウは、ステートフルではありません")また、00:01ではなく00:00にプログラムを実行する必要があります – Aaron

関連する問題