私はサンプルジョブを自分の側で実行しています。スパークジョブのUIには、合計稼働時間は26秒ですが、ジョブの継続時間列を追加すると約17-18秒です。私は自分の仕事の実行ロジックを実行するための合計時間を決定するために頼りにしています。私はクラスタの起動と停止にかかる時間は心配していません。その時間も含めて26秒です。クラスタを起動してクラスタを停止し、自分のロジックの最終実行時間を取得する時間。スパークWeb UIの表記
また、私の火花の設定は次のようになります。
val conf = new SparkConf().setAppName("Metrics").setMaster("spark://master:7077").set("spark.executor.memory", "5g").set("spark.cores.max", "4").set("spark.sql.warehouse.dir", "file:///c:/tmp/spark-warehouse")set("spark.executor.memory", "5g")
val sc = new SparkContext(conf)
val sqlContext = new org.apache.spark.sql.SQLContext(sc)
私は.Iがそれを設定することにより、すべてのコアを使用しようとしています4つの論理コアすなわち2つの物理コアと2仮想コアマシンを持っていますいくつかの理由で1人のエグゼキュータがジョブを実行するために使用されます。誰かがなぜ1人のエグゼキュータが生成されたのか、そしてスパークの世界ではコアとエグゼキュータの関係は何かを説明できますか?私はスパークするために新しいですので、どんな助けも素晴らしいでしょう。
説明のためにありがとう、spark web uiが稼働時間で26秒、継続時間列で15秒を示す理由についての最初のクエリについて考えていますか? – baiduXiu