gpcrondumpは、バックアップを並行して実行します。基本的には、すべてのセグメントにわたってバックアップを調整します。デフォルトでは、各セグメントは、各セグメントの$ PGDATAディレクトリにdb_dumpsディレクトリを作成し、その下に日付形式のサブディレクトリを作成します。
たとえば、ホストあたり4つのセグメントがあり、sdw1-4をホストしているとします。ダンプは次の場所に作成されます:
/data1/gpseg0/db_dumps/20161111/
/data1/gpseg1/db_dumps/20161111/
/data2/gpseg2/db_dumps/20161111/
/data2/gpseg3/db_dumps/20161111/
これはすべてのセグメントにわたって繰り返されます。
セグメントは、そのデータのみをこのダンプ・ロケーションにダンプします。 grcrondumpは、各セグメントが他のセグメントとは独立してデータをダンプするので、ファイルに名前を付け、正常に完了したかどうかを確認します。したがって、それは並行して行われる。
マスターにもバックアップディレクトリが作成されますが、この場所にはデータはあまりありません。主に実行されたバックアップに関するメタデータです。
各バックアップのメタデータは非常に重要です。セグメントIDとバックアップのコンテンツIDが含まれています。
gpdbrestoreは、gpcrondumpによって作成されたバックアップを復元します。ファイルを読み取り、データベースにロードします。それらのバックアップファイルを読み取り、セグメントIDとコンテンツIDがターゲットと一致することを確認します。したがって、バックアップからのセグメント数は、復元するセグメント数と一致する必要があります。また、セグメントIDとコンテンツIDのマッピングも同じでなければなりません。
1つのクラスタからの移行は、複数の方法で実行できます。 1つの方法は、バックアップを行い、次に復元することです。これには、両方のクラスタで同じ構成が必要です。すべてのバックアップファイルをあるクラスタから別のクラスタにコピーする必要があります。また、DataDomainなどのバックアップデバイスからバックアップして復元することもできます。
組み込みツールコールgptransferを使用することもできます。これはバックアップを使用せず、一方のクラスタから別のクラスタに外部テーブルを使用して転送します。このツールを使用する場合、2つのクラスターの構成は同じでなくても構いませんが、より大きなクラスターからより小さいクラスターに進む場合、並列では行われません。
私はあなたのピボットアカウント担当者に助けを求めることを強くお勧めします。移行作業の一部または全部をカバーする新しいDCAを購入するときには、すでにサービスを購入したことがあります。2つのクラスタ間でネットワークを構成する必要があります。これはEMCの助けを必要とします。
幸運!
ありがとうございました。バックアッププロセスに関しては本当に参考になりました。また、この問題についてEMCネットワークチームのサポートを受けたいと考えています。 – NEO