私はスパークでアテナを使用する必要がなく、JDBCドライバを使用した場合、スパークはPreparedStatementを使用していますし、それは私に例外を与える 「com.amazonaws.athena.jdbc.NotImplementedException:メソッドのConnection.prepareStatementはまだ実装されていません」スパークアテナコネクタ
をあなたは私に火花のアテナを接続する方法を教えてください
私はスパークでアテナを使用する必要がなく、JDBCドライバを使用した場合、スパークはPreparedStatementを使用していますし、それは私に例外を与える 「com.amazonaws.athena.jdbc.NotImplementedException:メソッドのConnection.prepareStatementはまだ実装されていません」スパークアテナコネクタ
をあなたは私に火花のアテナを接続する方法を教えてください
私はあなたがスパークからアテナに接続したいのか分からないが、あなたはする必要はありません - あなたは非常に簡単にアテナが含まれているデータを照会することができます(または、より正確には、 "レジスタ")をSparkから取得します。
アテナ
には2つの部分EMRクラスター(v5.8.0以降)を起動すると、グルーデータカタログに接続するように指示できます。これは 'クラスタの作成'ダイアログのチェックボックスです。このオプションをチェックすると、Spark SqlContext
がグルーデータカタログに接続し、Athenaのテーブルを見ることができます。
これで、通常どおりこれらのテーブルをクエリできます。
詳細はhttps://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-spark-glue.htmlを参照してください。
アッカに直接スパークを接続することはできません。 Athenaは単にs3をターゲットにしたPrestodbの実装です。 Prestoとは異なり、AthenaはHDFSのデータをターゲットにすることはできません。
しかし、s3のデータを照会するためにSparkを使用する場合は、HUEと運が良かったので、s3のデータをSpark on Elastic Map Reduce (EMR)から照会することができます。また
を参照してください: Developer Guide for Hadoop User Experience (HUE) on EMR.
アテーナーののデータを使用する場合は、@ Kirk Broadhurstの応答が正しいです。 Athenaエンジンを使用する場合は、githubのlibにpreparedStatement
の問題を解決してください。
私はlibを使用することに成功しなかったことに注意してください.Mavenなどの経験が不足しているため、