2016-09-05 5 views
0

Amazon Redshiftはクラスタ内の値の配布に何を使用しますか:ハッシュまたはBTree?Amazon Redhsiftでの配布 - BTreeまたはハッシュ

たとえば、配布キーの日付が "yyyy-MM-dd"の場合、同じノード(Btreeが使用されている場合)またはおそらく異なるノードに格納される予定です(ハッシュがこれはおそらくそうであろう)?

ありがとうございました

答えて

2

スマート質問。ほとんどのRDBMSがどのように動作するかを知っています。

Bツリーはありません。

ハッシュ関数は、あなたの分散キーに適用され、ハッシュ関数の結果は、スライスがあなたのデータを受け取るかを決定します。

従来の意味でのインデックスはありません。 Redshiftは「スーパーブロック」内の情報を使用して、特定のクエリに対して完全なテーブルスキャンを行わないようにするかどうかを決定します。私から欠落しているもの

  1. DISTRIBUTION KEY --- The most important design decision in an MPP system.
  2. COMPRESSION -- This can be done automatically as you load the database.
  3. SORT KEY -- Getting a good sort key is extremely important for large tables.
  4. ANALYZE and VACUUM --- This ensures that the SORT Key is optimized and the database has good statistics.

お知らせ:大規模データ用

は劇的にパフォーマンスが向上します4つの慣行がある設定しますリスト?はい、私はインデックスを言っていませんでした。 Redshiftにはインデックスがありません。