Redshiftを使用して倉庫を探しており、既存のオンプレミスのPostgres DBから夜間にRedshiftに新しいデータを移動する必要があります。プライマリdbがRDSの場合はPipelineとテンプレートでこれを行うことができますが、データベースがオンプレミスの場合はPipelineで行うことができますか?AWS Pipelineを使用してオンプレスポストグルをRedshiftにインクリメンタルコピーする
0
A
答えて
0
定期的に一括して同期をとっているので、データをS3にプッシュすることを検討してください(オンプレミスから簡単に実行してから、COPYコマンドを使用して赤方偏移にロードすることを検討してください)。高速で信頼性が高く、副作用としてs3で無料(安価)のバックアップを取得します。定期的にpostgresのに続い
aws s3 cp current_dump.csv.gz s3://yourbucket/20170108/dump.csv.gz
て実行するpsqlユーティリティを:あなたが好きなもので(.aws/config
であなたのアクセスキーを入れた後で)あなたのCSVのpostgresのダンプを押し上げるawscliのpythonツールからaws s3 cp
を使用することができます
そのような赤方偏移のCOPY:
PGPASSWORD='YOURPASS' psql -h your.redshift.end.point.com -U youruser -d yourdb -p 5439 -c "COPY yourtable FROM 's3://yourbucket/20170108/dump.csv.gz' CREDENTIALS 'aws_access_key_id=[YOURKEY];aws_secret_access_key=[YOURSECRET]' DELIMITER ',' NULL 'NULL' IGNOREBLANKLINES EMPTYASNULL BLANKSASNULL TIMEFORMAT 'auto' FILLRECORD MAXERROR 1 CSV GZIP;"
あなたは時間値のビットスクリプトをシェルスクリプトであなたのPostgresのダンプと、これらのコマンドを入れて、cronジョブとして、それを実行することができます。
ベストプラクティスのために、必要に応じて更新をサポートし、重複を防止するためにupload to a staging table and then mergeをメインテーブルに追加します。
+0
Thanks @systemjack!間違いなくこのワークフローを検討します。 – gignosko
関連する問題
- 1. AWS Pipelineを使用してS3からRedShiftに転送中のJSONファイルを平滑化
- 2. AWS Data Pipeline JsonPathsを含むS3からRedshiftへのDynamoDB
- 3. AWS Redshiftのキャッシュをクリアします
- 4. redshiftでDISTINCTを使用してlistagg
- 5. RedshiftをPentaho PDIデータベースリポジトリとして使用
- 6. AWS Data Pipelineを使用してCSV/TSVファイルに列ヘッダーを作成しますか?
- 7. AWS Pipelineデプロイメントクラウドの情報
- 8. AWS Redshift - 列を条件として定義しますか?
- 9. AWS Kinesis FirehoseがRedshiftにデータを挿入していません
- 10. tableauとredshiftのためにadfsを使用してシングルサインオンを実装します
- 11. AWS APIを使用してRedshiftクラスタのARNをどのように決定しますか?
- 12. Artifactory - Jenkins Pipelineスクリプトを使用してアップロードする
- 13. jenkins pipelineプラグインを使用する方法
- 14. Jenkins Pipelineを使用したMavenリリース
- 15. AWS Redshiftクエリ複数スキーマ
- 16. AWS RedShift - .NETコア(ODBCサポート)
- 17. AWS Redshift LOCK WRITEとREAD NOT
- 18. AWS Redshiftの最大値
- 19. Redshift COPYコマンドとAWSデータパイプラインRedshiftCopyActivity
- 20. サーバーレスアーキテクチャを使用してS3からRedshiftにデータをロードするにはどうすればよいですか?
- 21. AWS SDKを使用してAWSコンソールにサインインするiOS
- 22. AWS Redshift User Activityを解析してオブジェクトにログインする方法は?
- 23. scikit-learn PipelineとGridSearchCVを使用しているときのエラー
- 24. Spark 2.0.1を使用してRedshiftにデータを書き込む
- 25. R PostGreSQLを使用してRedshiftでテーブルをCSVにエクスポート
- 26. Apache Nifiを使用してverticaからRedshiftにデータを転送
- 27. Rails Asset Pipelineを使用してアプリケーションと同じサーバーにスタイルシートをホストする
- 28. aws redshiftでクロスリージョンのコピーテーブルを自動化
- 29. ローカルでdjango-pipelineを使用しています
- 30. AWS DMS MySql AuroraをRedshiftレプリケーションに最適化する方法は?
これを行うことはできますが、パイプラインはその目的のために作られていません。 –