Run SparkR |私のCloudera 5.9 SparkのRパッケージ

CentOS 6.7でCloudera 5.9を実行しているノードクラスタが3つあります。私のRパッケージ（私のラップトップで動作している）をHadoopのクラスタモードで動作するSparkに接続する必要があります。Run SparkR |私のCloudera 5.9 SparkのRパッケージ

しかし、ローカルRをSparklyr Connectを介してHadoop Sparkに接続しようとすると、エラーが発生します。それはラップトップ自体でスパークの家を探しているので。

私はグーグルでSparkRをインストールし、SparkでRを使用できることがわかりました。しかし、私は同じことに関するいくつかの質問があります。

私は https://amplab-extras.github.io/SparkR-pkg/からtarファイルをダウンロードしている。しかし、私の質問は、私が直接私のLinuxサーバーにコピーしてインストールのですか？
スタンドアロンではない既存のスパークを停止/削除する必要がありますか？とYarnを使用している、つまりクラスタモードで動作していますか？またはSparkRはの上で実行できますか、それをサーバーにインストールすればいいですか？
Sparkをスタンドアローンモードで実行する必要がありますか（スパークゲートウェイを実行し、スクリプトを使用してマスター/スレーブを起動する）、その上にlinuxコマンドラインからパッケージをインストールする必要がありますか？
インストールされていれば、CM UIからアクセスできますか？

私はこれを初めてお手伝いしており、本当に指導が必要です。

おかげで、シルパ

2017-01-03 TextShilpa

どのようにスパーククラスタに接続しようとしたのですか？この回答は役に立ちます：http://stackoverflow.com/a/38107699/2026277 –

あなたは上記の質問

2017-01-11 09:00:39 Yasodhara

上SparkRのRをインストールしてからインストールするための最良の方法への回答を見つけることができます。これらのリンクをたどりますそれはここにあります：http://blog.clairvoyantsoft.com/2016/11/installing-sparkr-on-a-hadoop-cluster/

このリンクの後にインストールできました。本当に便利で最新です。

おかげで、シルパ

2017-01-28 01:57:55 TextShilpa

答えて