Sparkの赤色シフトテーブルからデータを読み取るためにデータレンガが提供するspark-redshiftライブラリを使用しています。リンク:https://github.com/databricks/spark-redshift。EMRでspark-redshiftで接続タイムアウト例外が発生しました
注:私の場合、赤方偏移クラスタとEMRクラスタのAWSアカウントは異なります。
スパークローカルモードでスパークレッドシフトを使用して、赤方偏移に接続することができます。しかし、次の例外を除いて、同じコードがEMRで失敗します。java.sql.SQLException:接続の設定エラー:接続がタイムアウトしました。
私のEMRクラスターのEC2セキュリティーグループの受信ルールにRedshiftを追加しようとしましたが、それは役に立たなかった。私はこれをやっている間にSourceをMyIPとして使いました。