私はSpark 2.1.0を使用しています。1つのアクションで2つのジョブが生成されるのはなぜですか?
なぜ次の1つのアクションが2つの同一のジョブ(それぞれ同じDAG)を生成するのですか?それはちょうど1を生み出すべきではないか?ここにコードがあります:
val path = "/usr/lib/spark/examples/src/main/resources/people.txt"
val peopleDF = spark.
sparkContext.
textFile(path, 4).
map(_.split(",")).
map(attr => Person(attr(0), attr(1).trim.toInt)).
toDF
peopleDF.show()
私はそれが何が起こっているかを確認する際にグラフィックインターフェイスで参照してください?私はそれがすべてのデータフレーム変換と関係があると思います。
スパークのバージョンは何ですか? SQLクエリのスクリーンショットを添付したり、ジョブから添付することはできますか? –
Spark 2.1.0の使用。 "SQLクエリとジョブから"どこで見つけることができますか? GUIでは、単にジョブ、ステージ、タスクを参照してください。ところで、履歴サーバーを使用しています。 – Juani
ヒストリサーバはSparkアプリケーションの実行後Web UIを提供する必要があります。Sparkアプリケーションを選択すると、ジョブとステージの横にSQLタブが表示されます。これはデフォルトで有効になっています。クラスタマネージャとは何ですか?糸? –