2016-08-09 3 views
1

Amazon Redshiftを初めて使用しています。 redshiftで2つのテーブルを結合する最良の方法を見つけようとしています。
私は23億レコードの1つのテーブルを持っていて、IDカラムには、ソートキーとdistキーを持つデータ型varchar(40)があります。
同じ列IDの2300万レコードを持つ他のテーブルとの左結合を実行しています - ソートキーとdistキー。
クエリの実行に時間がかかります。私がここで間違っていることは何ですか?
vshar(40)と2.3億行の赤方偏移結合

答えて

0

STL_ALERT_EVENT_LOGテーブルのアラートがある場合は、クエリで「EXPLAIN」を使用して、クエリが一般的に最速の結合(マージ結合)を使用しているかどうかを確認することもできます。データスキューまたはソートされていない行を持つ表を特定する必要があります(Redshiftのドキュメントを参照)。

+0

ありがとう!私は使用された結合クエリのタイプを決定するために 'Explain'を使用し、それがハッシュ結合を使用していることが判明しました。実行された真空、ほとんど10時間かかりました、そして今私は5分で結果を得ます。 –

関連する問題