現在、私はスタンドアロンモードでスパーククラスタを実行しています。フラットファイルまたはCassandra
(ジョブによって異なる)からデータを読み込み、処理したデータをCassandra
に書き戻しています。私はHadoop
に切り替えてYARN
またはmesos
ようResource manager
を使用して起動した場合スタンドアロンモードでsparkクラスタを実行すると紡績/兵器
私が思っていた、それは私の実行時間と優れたリソース管理などの追加的なパフォーマンスの優位性を与えるのでしょうか?
現在、私はシャッフリング中に大量のデータを処理していて、ステージが失敗する可能性があります。 YARN
に移行した場合、Resource manager
でこの問題に対処できますか?
あなたの基本的な間違った相棒は、スタンドアロンクラスタを簡単にノードの数百を件まで拡張することができガット:
はスタンドアロンとMesosオーバーYARNの利益のため、関連するSEの質問を見てください。クラスタ管理者を区別するスケジューリング機能。 [http://spark.apache.org/docs/latest/security.html](http://spark.apache.org/docs/latest/security.html)と[http://www.agildata]を参照してください。 COM/apacheのスパーククラスタ・マネージャ・糸mesos-またはスタンドアロン/(http://www.agildata.com/apache-spark-cluster-managers-yarn-mesos-or-standalone/)私は –一定期間に渡って無関係となった古いコンテンツを削除しました。 –