2016-11-11 7 views
0

私たちはgreenplum DCA V1とV3の小さな配列を持っています。 それらの間でバックアップ/リストアの処理手順を実行しようとしています。Greenplum DCA - バージョンV2をV3にバックアップ&復元する方法

DCAアプライアンスの初心者として、論理的な方法で並列バックアッププロセスを理解するために壁に頭を当ててください。

試しました 並列バックアップを試みています。 gpcrondump/gpdbrestoreを使用してください。しかし、それを実行する方法の作業工程を理解していなかった

on Master host 
on segment host 

質問は次のとおりです。 バックアップバージョンからのバージョンにマスターセグメントDCA ENVでどのように動作する並列。

答えて

2

gpcrondumpは、バックアップを並行して実行します。基本的には、すべてのセグメントにわたってバックアップを調整します。デフォルトでは、各セグメントは、各セグメントの$ PGDATAディレクトリにdb_dumpsディレクトリを作成し、その下に日付形式のサブディレクトリを作成します。

たとえば、ホストあたり4つのセグメントがあり、sdw1-4をホストしているとします。ダンプは次の場所に作成されます:

/data1/gpseg0/db_dumps/20161111/ 
/data1/gpseg1/db_dumps/20161111/ 
/data2/gpseg2/db_dumps/20161111/ 
/data2/gpseg3/db_dumps/20161111/ 

これはすべてのセグメントにわたって繰り返されます。

セグメントは、そのデータのみをこのダンプ・ロケーションにダンプします。 grcrondumpは、各セグメントが他のセグメントとは独立してデータをダンプするので、ファイルに名前を付け、正常に完了したかどうかを確認します。したがって、それは並行して行われる。

マスターにもバックアップディレクトリが作成されますが、この場所にはデータはあまりありません。主に実行されたバックアップに関するメタデータです。

各バックアップのメタデータは非常に重要です。セグメントIDとバックアップのコンテンツIDが含まれています。

gpdbrestoreは、gpcrondumpによって作成されたバックアップを復元します。ファイルを読み取り、データベースにロードします。それらのバックアップファイルを読み取り、セグメントIDとコンテンツIDがターゲットと一致することを確認します。したがって、バックアップからのセグメント数は、復元するセグメント数と一致する必要があります。また、セグメントIDとコンテンツIDのマッピングも同じでなければなりません。

1つのクラスタからの移行は、複数の方法で実行できます。 1つの方法は、バックアップを行い、次に復元することです。これには、両方のクラスタで同じ構成が必要です。すべてのバックアップファイルをあるクラスタから別のクラスタにコピーする必要があります。また、DataDomainなどのバックアップデバイスからバックアップして復元することもできます。

組み込みツールコールgptransferを使用することもできます。これはバックアップを使用せず、一方のクラスタから別のクラスタに外部テーブルを使用して転送します。このツールを使用する場合、2つのクラスターの構成は同じでなくても構いませんが、より大きなクラスターからより小さいクラスターに進む場合、並列では行われません。

私はあなたのピボットアカウント担当者に助けを求めることを強くお勧めします。移行作業の一部または全部をカバーする新しいDCAを購入するときには、すでにサービスを購入したことがあります。2つのクラスタ間でネットワークを構成する必要があります。これはEMCの助けを必要とします。

幸運!

+0

ありがとうございました。バックアッププロセスに関しては本当に参考になりました。また、この問題についてEMCネットワークチームのサポートを受けたいと考えています。 – NEO

関連する問題