2017-08-09 5 views
0

初めてgreenplumを設定しています。私はdocumentationに従っています。私はSQLからgreenplumデータベースへの接続を設定したい。現在、これを達成するための最良の方法が何であるかを把握しています。私はgpfdistとgploadに出くわしました。gpfdist vs gpload greenplum

どのように2つの違いがありますか?どちらも外部表を使用するため、どちらもスレーブ・ノードで動作し、パラレル・ロードに使用されます。だから、他のものを使用することの利点はありますか?

+0

gploadは、外部テーブルとgpfdistの使用を自動化するツールです。あなたはgpfdistを直接使うこともgploadを使うこともできます。基本的には同じことです。 –

答えて

0

"SQLからgreenplumデータベースへの接続を設定します" ... あなたが参照しているSQLデータベースがあいまいです。

また、非greenplumデータベースをgreenplumデータベースに接続するための直接接続ドライバはありません。

ただし、OracleからGreenplumにデータを移行する場合は、Informaticaのfastcloneツールを使用できます。

gpfdistとgploadに関する2番目の質問にお答えします。 GPFDISTは、ホストシステム上で動作するファイル分散プロセスであり、多くのセグメントに対して並列にファイルを提供します。ファイルから読み書きする外部テーブルを初期化する際に、ファイルを処理するプロセスを指定する必要があります。その場合はGPFDISTになります。 FTP、GPHDFS、HTTPのような他のプロセスもあります。

GPLOADは、gpfdistプロセスと外部テーブルを自動的に作成することで作業を楽にするラッパーユーティリティです。

GPLOADは読み取り可能な外部テーブルのみを作成できることにも注意してください。

関連する問題