Sparkアプリケーションを4ノードでテストするためのマルチノードクラスタをセットアップしました。 各ノードには250GBのRAMと48コアがあります。 1つのノードでマスターを実行し、3つをスレーブとして実行します。Apacheのスパークアプリケーションの実行パラメータを設定するには
そして、私たちはスカラを使ってスパークアプリケーションを開発しました。 spark-submitオプションを使用してジョブを実行します。 ここでは、私たちが打ち負かされている点について説明し、進めるためにはより明確な説明が必要です。
クエリ1: スパークジョブを実行するのに最適なオプションはどれですか。 a)マスターとしてスパーク b)マスターとして と違い。
クエリ2:任意のスパークジョブを実行中 我々は執行、コアの無い、エグゼキュータメモリなどの数のようなオプションを提供することができますが、パフォーマンス向上のために、これらのパラメータの最適値がどうなるかアドバイスしてもらえ
私の場合。
それはスパークで始まる誰にとっても参考になるので、すべてのヘルプは非常に高く評価されるだろう:)
感謝。!!
について最適な値、その主観的なものをご覧ください。この2つの記事を読んでください - https://blog.cloudera.com/blog/2015/03/how-to-tune-your-apache-spark-jobs-part-1/ – Pushkr