アラートを格納するための効率的なインデックススキーマが必要です。 Accumulo:効率的なクエリのためのデータのインデックス方法
- 私は次のクエリを実行する必要があり、タイムスタンプ
- タイプ
- 場所
:各アラートには、次の属性を持っていたどのように多くのアラート
- を定義された日付範囲で作成されますか?
- 定義された日付範囲でタイプXのアラートがいくつ作成されましたか?
- 定義された日付範囲でロケーションYからアラートがいくつ作成されましたか?
は、しかし、私は、クエリのパフォーマンスは、私の#2 &#3クエリのユースケースのために悪くなると思う:ROWID -> alertId_timestamp, CF -> attribute (type, location), CQ -> value
私の最初に考えたのは、以下の指標aにしました。データのインデックスを作成するにはどうすればよいですか?
検索をサポートするにはどのくらいの期間が必要か、3つの照会の実行速度? – elserj
日付の範囲は30日を超えないようにしてください。 3秒以内に各クエリが返されることを願っています。 – user1040535
もう1つ質問:アラートの数とアラートの平均サイズ(1日の合計バイト数を計算する)の両方で、1日あたりのアラートの数。 – elserj