は、Spark StreamingのreduceByKeyAndWindow関数に関する質問があります。これは素朴かもしれませんが、ScalaとSparkの両方にとって新しいものです。 Spark StreamingのreduceByKeyAndWindowを複数の値で使用
を実行する方法はありカウント(ロング): 列1:キー、 コラム2:金額(ロング)、 3列は私のデータを解析した後、私は3つの列と、このデータセットを持っていますreduceByKeyAndWindow関数を使用して、指定されたウィンドウ上のColumn 2(Amount)とColumn 3(Count)の合計を取得しますか?私が読んだものから、
、reduceByKeyAndWindow機能のように見えるので、私が現在やっていることは二つのデータセットを作成して、2つの列のみ(キー、値)を見込ん: データが1を設定:キー、& & 金額をデータセット2:キー
次に、reduceByKeyAndWindowを2回呼び出しています。 1回だけ行うことができれば素晴らしいと思います(減らすパラメータは量とカウントの両方の列と同じです)
この質問は意味がありますか?どんな入力も素晴らしいでしょう!
ThxをKnight71のために動作します!これはうまくいった。追加する関数と減算する関数の2つの関数を作成します(ウィンドウ外にあるバッチの場合)。 reduceByKeyAndWindow(reduceByKeyAndWindow(aggregateFuncAdd、aggregateFuncSubtract、Minutes(windowLength.toLong)、Seconds(slideInterval.toLong)、2)関数をreduceByKeyAndWindowに追加するのは簡単でした。 – Shay