0
私はJDBC connectorを使用してPySparkアプリケーションからリモートのPostgresサーバ上で次のクエリを実行したい:Pygark JDBCコネクタを使用してPostgresでPostgres SQL関数をリモートで実行するには?
SELECT id, postgres_function(some_column) FROM my_database GROUP BY id
問題は、私は明らかにpostgres_function
ので、spark.sql(QUERY)
を使用してPysparkに、クエリのこの種を実行することはできませんですANSI SQL関数supported since Spark 2.0.0ではありません。
私はSpark 2.0.1とPostgres 9.4を使用しています。