1
Postgres DBからPySparkでテーブルを読み込もうとしています。私は、次のコードを設定し、SparkContextが存在を確認しました:PySpark sqlContext read Postgres 9.6 NullPointerException
import os
os.environ['PYSPARK_SUBMIT_ARGS'] = '--driver-class-path /tmp/jars/postgresql-42.0.0.jar --jars /tmp/jars/postgresql-42.0.0.jar pyspark-shell'
from pyspark import SparkContext, SparkConf
conf = SparkConf()
conf.setMaster("local[*]")
conf.setAppName('pyspark')
sc = SparkContext(conf=conf)
from pyspark.sql import SQLContext
properties = {
"driver": "org.postgresql.Driver"
}
url = 'jdbc:postgresql://tom:@localhost/gqp'
sqlContext = SQLContext(sc)
sqlContext.read \
.format("jdbc") \
.option("url", url) \
.option("driver", properties["driver"]) \
.option("dbtable", "specimen") \
.load()
は、私は次のエラーを取得する:
Py4JJavaError: An error occurred while calling o812.load. : java.lang.NullPointerException
私のデータベースの名前はgqp
で、表がspecimen
であり、それが実行されて確認しましたlocalhost
で、Postgres.app macOSアプリケーションを使用してください。