0
私はAmazon Redshiftにいくつかの非常に大きなデータテーブルを構築しています。これは、頻繁にクエリされるいくつかのプロパティと、関連するメトリックをカバーするデータを保持する必要があります。Redshift Composite Sortkey - 使用する列の数はいくつですか?
すべてのノードがクエリの計算に参加するために均等分布スタイル(「diststyle even」)を使用していますが、ソートキーの長さについてはわかりません。
間違いなく、すべてのクエリで日付とネットワークの最初のフィルタが使用されますが、そのレベルの後には、クエリ可能な関連要素が7つあります。 私が見たすべての例では、2〜3フィールドの複合ソートキーを使用しました。
私の質問は、テーブルのすべてのキーフィールドを含むソートキーを使用しないことですか?長いソートキーを持っていることの短所は何ですか?
まあ、テーブルのすべての列を含むインデックスを作成すると、わずかな数の列のみを含むインデックスを作成する場合よりも多くの領域が占有されます。スペースが問題であれば、これはあなたの質問に対する答えかもしれません。 –