私はpySparkでSpark 2.0を使用しています。Spark 2.0:GetOrCreateでSparkSessionパラメータを再定義し、WebUIで変更を表示しない
私は2.0で導入されたGetOrCreate
方法を通じてSparkSession
パラメータを再定義しています。そこに有効なグローバルなデフォルトSparkSessionであり、そうならば、その1を返すかどうかをこのメソッドに
最初のチェックを。有効なグローバルデフォルトSparkSessionが存在しない場合、このメソッドは新しいSparkSessionを作成し、新しく作成されたSparkSessionをグローバルデフォルトに割り当てます。
既存のSparkSessionが返された場合、このBuilderで指定された設定オプションが既存のSparkSessionに適用されます。
from pyspark import SparkConf SparkConf().toDebugString() 'spark.app.name=pyspark-shell\nspark.master=local[2]\nspark.submit.deployMode=client' spark.conf.get("spark.app.name") 'pyspark-shell'
は、その後、私は
のappName(名前)
設定のWebUIの変化を見るために約束してSparkSession
設定を再定義:これまでのところは良い
https://spark.apache.org/docs/2.0.1/api/python/pyspark.sql.html#pyspark.sql.SparkSession.Builder.getOrCreate Spark Web UIに表示されるアプリケーションの名前です。今
c = SparkConf()
(c
.setAppName("MyApp")
.setMaster("local")
.set("spark.driver.memory","1g")
)
from pyspark.sql import SparkSession
(SparkSession
.builder
.enableHiveSupport() # metastore, serdes, Hive udf
.config(conf=c)
.getOrCreate())
spark.conf.get("spark.app.name")
'MyApp'
私はlocalhost:4040
に行くとき、私は、アプリ名としてMyApp
見ることを期待します。
しかし、私はまだ私は間違っpyspark-shell application UI
を参照してください?
ありがとうございます!