2016-11-30 2 views
0

Pythonでは、バックスラッシュや括弧を使って行を複数の行に分割することができます。Pysparkで複数の行に分割する方法

しかし、私はこれを行うときに何とかして、次の行を赤色にして、何かが間違っているかもしれないことを示します。

(conf.setAppName('Learnfit_Recommender') 
.set("spark.executor.memory", "10g") 
.set("spark.executor.cores",5) 
.set("spark.executor.instances",50) 
.set("spark.yarn.executor.memoryOverhead",1024) 
) 

EDIT 1:かっこをバックスラッシュに変更しました。そして、あなたがイメージを見ると、私はいくつかの 'を参照してください。赤で表示され、sc変数でさえ赤で表示されます。

enter image description here

これはpysparkで行を分割するための正しい方法は何ですか?そしてスパークの例では、あなたがそうであるようにpysparkで行を分割するために、バックスラッシュや括弧のどちらかを使用することができます

./bin/spark-submit \ 
--master <yarn> \ 
--deploy-mode <cluster> \ 
--num-executors <2> \ 
--executor-cores <2> \ 
+0

ファイルを実行しようとしましたか? – avr

+0

ファイルはうまく動作します。しかし、私の懸念は、以下の行を示していますsc = red(sp)sc = sparkContext(conf)私はこれを実行するためにジュピターノートを使用しています – Baktaawar

+0

@avr pls編集を確認します – Baktaawar

答えて

2

あなたは

spark = SparkSession \ 
    .builder \ 
    .appName("Python Spark SQL basic example") \ 
    .config("spark.some.config.option", "some-value") \ 
    .getOrCreate() 

編集スラッシュや括弧を使用することができますPythonで。

あなたは彼らがPySparkにバックスラッシュの前に空白を追加する必要はありませんスパークウェブサイトhere

+0

画像で編集を確認します – Baktaawar

+0

カーソルがそうでない限り、あなたは '|'文字を持っているようです。私はJupiter NotebookでPySparkを使っていますが、なぜそれを構築していますか? Sparkパスをbashプロファイルに追加するだけです。 'conf = conf'と書いても冗長であるようですが、すでにあなたの最初の行に指定しています。 –

+0

いいえ、カーソルはありません。私が設定をテストしているので、現在は追加したくないBashプロファイル適切な設定が見つかると、それらをbashプロファイルに追加できます – Baktaawar

0

仕事サブミット:

0

に公式スパークPythonの例で使用しています。

conf = SparkConf() 

conf.setAppName('appName')\ 
.set("spark.executor.memory","10g")\ 
.set("spark.executor.cores",5) 

sc = sparkContext(conf=conf) 
関連する問題