私は現在シナリオをテストするのに十分なデータがありませんが、unload
クエリでorder by句を使用すると、parallel on
のRedshift unload
コマンドがソートされたデータをs3の複数のパートファイルにアンロードするかどうかを知る必要がありますか? parallel off
を使用すると、ソートされたデータをs3にシリアルにアンロードできることが分かります。Order by句を使用してソートされたデータをパラレルで保証するRedshift unloadコマンドはありますか?
SELECTクエリ:
赤方偏移のドキュメントを約unloadを述べています。クエリの結果はアンロードされます。ほとんどの場合、問合せにORDER BY句を指定することで、データをソート順にアンロードすることは有益です。この方法は、データがリロードされたときにソートするのに必要な時間を節約します。
このトピックに関する関連リンクは参考になります。