2
これらのフィールドには、タイムスタンプ、イベント名、イベント値、これらのフィールドを持つ500mレコードの毎日の赤方偏移テーブルがあります。Redshift - 列の値に基づいてテーブルを分割する
「X」という名前のすべてのイベントを取得し、別のレッドシフトテーブルに入れるクエリが必要です。
私たちが単純なinsert into... select * where eventname=x
を実行すると、パフォーマンスは恐ろしい(30分実行)。
どうすればいいですか?
は、あなたが持っていますeventnameに – lordkain
上のインデックスがあります元のテーブルと宛先テーブルに割り当てられたDISTKEYとSORTKEY?両方のテーブルで同じ値ですか? (それはノード間でのデータのコピーを避けるのに役立つかもしれません)500mのレコードのうち、「X」という値を持つのはどれくらいですか?完全な 'INSERT INTO ... SELECT *'( 'WHERE'なし)を実行すると、より速く実行されますか? –