EMR spark-shell --packages org.postgresql:postgresql:9.4-1206-jdbc42
にsshした後、spark-shellを実行するとpostgresqlドライバパッケージをインストールしました。その後、org.postgresqlをインポートします。私はspark Dataframeオブジェクトを作成したいので、s3インスタンスからテーブルにアクセスしようとします。AWS EMRインスタンスでspark経由でJDBCドライバにアクセスできない
sqlContext.load("jdbc", Map("url" -> "jdbc:postgresql://pathto.table.region.rds.amazonaws.com:5432/table?user=username&password=password","dbtable" -> "table"))
これは私にjava.sql.SQLException: No suitable driver
エラーになります。
私はthisの質問を同様の問題で調べました。しかし、私はスパークシェルを介してドライバを実行できるようにしたい。
はいおかげで、私はそれを試してみましたが、何かがJDBC java.lang.UnsupportedClassVersionErrorの私のバージョンが間違っているように見えます:ORG/postgresqlの/ドライバ:サポートされていないメジャー。マイナーバージョン52.0 –
[OK]を別の問題です。あなたの依存関係、スパーク、emrにインストールされているもの – eliasah