レポートアプリのデータエンジンとしてのApacheドリルの探索を開始しました。同種のデータストアのApacheドリル
私たちはトランザクションデータがすべてRDBMSであるため、PostGresショップです。
NoSQL(MongoDB)への移行は私たちにとって遠い夢であり、今日のようにそれに金を費やす必要はありません。
私たちのデータサイズは大きいですが(それでもPostGresではすべてです)。私たちはいくつかのテーブルを最大数億(たとえば150M)にまで及んでいます。
パフォーマンスは私たちにとって重要です。私たちは、レポートをできるだけ早くエンドユーザーにリアルタイムで生成させたいと考えています。
ネイティブ(直接)Postgresのクエリの時間コストが言うの場合:
は、私は私のユースケースのために、ここで基本的な質問を持っているドリルを経てP 、私はコストがに起こっている想像します次のようになります。P + D、Dはドリルの余分なコストですか?Postgresがボトルネックであることが判明した場合(インデックスの欠落など)、ドリルは何度も水平にドリルビットを追加しても状況を改善するのに役立ちません。
したがって、私のユースケースのヘルプでDrillを使用すると、PostGresを最適化して直接クエリするよりも、