s3のpg_dumpをredshiftにロード

Redshiftに完全なデータベースダンプをロードしようとしています。 s3にあるpg_dumpからRedshiftにデータを復元するコマンドが1つありますか？そうでない場合、これに取り組むための最善の手順は何ですか？あなたは非圧縮のpg_dumpをお持ちの場合はs3のpg_dumpをredshiftにロード

おかげ

出典

2017-11-30 nkramer52

これはpsqlのコマンドを使用して可能でなければなりません（手動で設定し、あなたのバージョンやオプションに応じて、右の構文を取得するために編集する必要があります）。しかし、これは赤方偏移を読み込むのに非常に非効率的で遅い方法であり、推奨しません。あなたのテーブルが大きければ数日か数週間かかります！

ソース表に基づいて赤方偏移のターゲット表を作成するのではなく、はソートキーと分布を考慮：

は何をする必要があると、このです。

アンロードします彼らはより速くをロードするように、ソースのcsvファイル（100メガバイトを言うよりも、例えばより）非常に大きいしている場合はpostgres を使用してCSVファイル「コピー」コマンド

にPostgresのソース表、は別々のファイルにこれらを分割を検討赤方偏移がをコピー使用することにより

はS3から赤方偏移にテーブルごとに別々のフォルダ

負荷で、S3にデータをこれらのCSVファイルをアップロードする（推奨しますが、必須ではない）

は、CSVファイルをgzip（赤方偏移は、並列化されます）コマンド

出典

2017-11-30 08:29:03

s3のpg_dumpをredshiftにロード

答えて

関連する問題