Bigデータ環境に新しく、Zookeeperを使用してHA機能を備えた3ノードHadoopクラスタ2.6をインストールすることから始まりました。HA機能を備えたHadoop Yarn Cluster上のApache Sparkデプロイ
NN1とNN2でzookeeperを使用してフェイルオーバーシナリオをテストし、うまくいきました。
私は、Hadoop YarnクラスタにHA Capabilityを搭載したApache Sparkをインストールすることを考えていました。
インストール手順を教えてもらえますか?スタンドアローンモードでスパークをセットアップする方法と、セットアップが正常に完了した方法しか見つけられませんでした。今私は、HAの機能と一緒に糸クラスタ内の同じをインストールしたい
I持つ3ノードクラスタ(NN1、NN2、DN1)、以下のデーモンは現在、これらの各サーバー上で実行されている、
Nodes running in Master NameNode (NN1)
Jps
DataNode
DFSZKFailoverController
JournalNode
ResourceManager
NameNode
QuorumPeerMain
NodeManager
Nodes running in StandBy NameNode (NN2)
Jps
DFSZKFailoverController
NameNode
QuorumPeerMain
NodeManager
JournalNode
DataNode
Nodes running in DataNode (DN1)
QuorumPeerMain
Jps
DataNode
JournalNode
NodeManager
私のhadoopクラスタでRMの高可用性をセットアップした後で、このブログに示されているように(http:// backtobazics .com/big-data/6-steps-to-setup-apache-spark-1-0-1-multi-node-cluster-on-centos /) –
このリンクは、スタンドアロンのスパーク設定を説明しています。 YARNでsparkを実行するには、クライアントマシンにsparkをダウンロードして、次のガイドラインを使用してジョブを起動する必要があります。http://spark.apache.org/docs/latest/running-on-yarn.html – facha