2017-01-03 8 views
0

CentOS 6.7でCloudera 5.9を実行しているノードクラスタが3つあります。私のRパッケージ(私のラップトップで動作している)をHadoopのクラスタモードで動作するSparkに接続する必要があります。Run SparkR |私のCloudera 5.9 SparkのRパッケージ

しかし、ローカルRをSparklyr Connectを介してHadoop Sparkに接続しようとすると、エラーが発生します。それはラップトップ自体でスパークの家を探しているので。

私はグーグルでSparkRをインストールし、SparkでRを使用できることがわかりました。しかし、私は同じことに関するいくつかの質問があります。

  1. 私は https://amplab-extras.github.io/SparkR-pkg/からtarファイルをダウンロードしている。しかし、私の質問は、私が直接私のLinuxサーバーにコピーしてインストール のですか?
  2. スタンドアロンではない既存のスパークを停止/削除する必要がありますか? とYarnを使用している、つまりクラスタモードで動作していますか?またはSparkRは の上で実行できますか、それをサーバーにインストールすればいいですか?
  3. Sparkをスタンドアローンモードで実行する必要がありますか(スパークゲートウェイ を実行し、スクリプトを使用してマスター/スレーブを起動する)、その上にlinuxコマンドラインからパッケージ をインストールする必要がありますか?
  4. インストールされていれば、CM UIからアクセスできますか?

私はこれを初めてお手伝いしており、本当に指導が必要です。

おかげで、 シルパ

+0

どのようにスパーククラスタに接続しようとしたのですか?この回答は役に立ちます:http://stackoverflow.com/a/38107699/2026277 –

答えて

関連する問題