2017-08-23 8 views
0

Redshiftインスタンス(VPC内)からAWS Glueを使用してS3バケットにETLデータを送信しようとしています。このために私はRedshiftでJDBC接続を作成しました。AWS VPCでのレッドシフトへのアクセス

クローラは、Redshiftのスキーマ情報をデータカタログに正常にフェッチします。しかし、ETLジョブを実行すると、データを取得できず、「リソースが利用できません」というメッセージが表示されます。

  1. Redshiftに接続するにはNATを設定する必要がありますか? (現在はNATを持っていません)
  2. NATがなくても、Redshiftからスキーマ情報を読み取ることができたのはどのようでしたか?

答えて

0

RedshiftはVPC内にあります。接着剤はあなたのVPCの内側にあります。 S3はそうではありません。 S3へのアクセスは、デフォルトではほとんどの場合、インターネットにアクセスする必要があります。

S3のデータにアクセスするには、NATガートウェイ、NATインスタンス、またはS3 VPC Endpointのいずれかを使用して、VPC内でS3トラフィックの終端ポイントを取得する必要があります。

+0

私はすでにS3 VPCエンドポイントを設定していました。クローラーがredshiftからスキーマ情報を読み取ることができるときに、ETLジョブが失敗する理由は何ですか?クラウドウォッチのログが作成されていないため、クラウドウォッチのログも表示されません。しかし、サンプルのGlueチュートリアルを実行してS3からS3までのETLデータを実行すると、正常に実行され、ログも作成されます。この問題を解決する方法についてのご指摘をいただければ幸いです。 –

+0

あなたが紛失している可能性があるかどうかは不明です。セキュリティグループの設定、多分? –

関連する問題