windowing

    0

    1答えて

    私はFlink 1.2-Snapshotを使用しています。 ID = 25398102、ソースID = 1、TS = 2016年10月15日午前〇時00分56秒、ユーザー= 14、値= 919 ID = 25398185、ソースID =:私のデータは以下のようになります。 1、ts = 2016-10-15 00:01:06、user = 14、value = 920 id = 25398210、

    0

    1答えて

    我々はスパークにウィンドウ機能を実装しようとしています。 SparkはKafka(5つのパーティションを持つ)を介してデータを受信して​​おり、処理のためにSpark Java DStreamを使用しています。 kafkaからカンマ区切りのデータをSparkのオブジェクトにマップすると、1秒でスライドする20秒のウィンドウが作成されます。このJava DStreamでは、出力をカウントして出力しま

    0

    1答えて

    私は、分秒のタイムスタンプでキー入力された60秒のデータを最大30秒の遅延で集計しようとしています。 ​​ 私はデータを受け取りました。透かしとタイムスタンプが設定されています。集計されたデータはohlcStreamAggregatedに送信されないため、ログに記録されません。 public TimestampExtractor(Time maxDelayInterval) { if

    0

    1答えて

    後行の選択: id | date | groupme1 | groupme2 | value ---------------------------------------- 1 | 2 | 3 | 今、私は次のことを達成したい:後にテーブルをグループ化 groupme1とgroupme2 各グループの値を取得 ただし、各グループの最後のエントリ(日付以降) 例: id | date

    -1

    1答えて

    こんにちは私はハイブにはとても新しいので、ハイブのWINDOWING機能を学んでいました。私は問題を見つけました。私はクエリを書いた (各ティッカーは22件のレコードを持っていると私は最低のを探していました)各株式相場の最安終値を見つけるためにしようとしていた : SELECT ticker, close FROM (SELECT ticker, close, RANK() OVER (

    0

    1答えて

    このロジックを使用してAzure Stream Analytic(ASA)ジョブでルールを作成しようとしています: "値がXとYの間にあり、その範囲を1分間引きしてからサービスバスに出力してください(そしてAzure関数でアラートを送信します)。この値が1分以内に範囲外にある場合は、ウィンドウをリセットする必要があります。 私はウィンドウ関数を読んできましたが、ASAの起動時にウィンドウが始まると

    1

    1答えて

    私はtableauの1つ以上のフィールドでパーティショニングする方法を理解できません。 データランドスケープ - 私は2次元のフィールドid(string)とplatformtype(str)を持っています。 total_usage(float)とmonth(int)の2つの尺度があります。 MacでTableau Desktop 10.3.3を使用する 目標 - 指定した月のtotal_usag

    1

    1答えて

    私のデータフレームでは、ローリングマックスとしてカラム '5D_Peak'を作成し、ピークに近い履歴データのローリングカウントを持つ別のカラムを作成したいとします。単純に、または理想的には計算をベクトル化する簡単な方法があるのだろうかと思います。 これは、プレーンが、複雑な方法で私のコードです: import numpy as np import pandas as pd df = pd.D

    0

    1答えて

    私は、特定のイベント(ロード)が発生したタイムスタンプに基づいて「セッションID」を作成しようとしているデータセットを持っています マイデータ: userid event timestamp xyz load '2016-12-01 08:21:13:000' xyz view '2016-12-01 08:21:14:000' xyz view '2016-12-01 08:21:1

    2

    1答えて

    私の問題をセットベースで解決するために1 1/2シフトを試みましたが、そこにはかなり到達できませんでした。カーソルで約15分でそれを解決し、それは十分に速く実行されます。 しかし、それはセットベースの方法があるのだろうかと思います。 私たちは、第三者のHRアプリケーションから抽出された従業員ステータス変更の記録を持っています:empid、recorddate、status。時間の経過とともにemp