2016-08-31 16 views
1

マスタとワーカを使用してSparkクラスタを起動するにはいくつかの問題があります。私はUbuntu 16.04 LTSにHadoop 2.7.3とSpark 2.0.0をダウンロードしてインストールしました。私はstart-master.shを使用してマスターを開始し、それはすべて大丈夫だ私はconfに/スレーブが私の奴隷のIPでファイルを作り、これが私のspark-env.shapache spark standalone clusterを起動できません

#!/usr/bin/env #bash 

export SPARK_DIST_CLASSPATH=$(hadoop classpath) 


export SPARK_WORKER_CORES=2 

export SPARK_MASTER_IP=192.168.1.6 
export SPARK_LOCAL_IP=192.168.1.6 

export SPARK_YARN_USER_ENV="JAVA_HOME=/usr/lib/jvm/java-8-oracle/jre" 

です。私は労働者を動かそうとするといくつかの問題を抱えています。

私が試した:(2)スレーブが明らかに開始された(1)Eで

(1) - start-slave.sh spark://192.168.1.6:7077 (from worker) 
(2) - start-slaves.sh (from master) 
(3) - ./bin/spark-class org.apache.spark.deploy.worker.Worker spark://192.168.1.6:7077 (from worker) 

が、マスターで:8080は、それは表示されませんでした。使い方(3)には、この例外がスローされます。

16/08/31 14:17:03 INFO worker.Worker: Connecting to master master:7077... 
16/08/31 14:17:03 WARN worker.Worker: Failed to connect to master master:7077 
org.apache.spark.SparkException: Exception thrown in awaitResult 
    at org.apache.spark.rpc.RpcTimeout$$anonfun$1.applyOrElse(RpcTimeout.scala:77) 
    at org.apache.spark.rpc.RpcTimeout$$anonfun$1.applyOrElse(RpcTimeout.scala:75) 
    at scala.runtime.AbstractPartialFunction.apply(AbstractPartialFunction.scala:36) 
    at org.apache.spark.rpc.RpcTimeout$$anonfun$addMessageIfTimeout$1.applyOrElse(RpcTimeout.scala:59) 
    at org.apache.spark.rpc.RpcTimeout$$anonfun$addMessageIfTimeout$1.applyOrElse(RpcTimeout.scala:59) 
    at scala.PartialFunction$OrElse.apply(PartialFunction.scala:167) 
    at org.apache.spark.rpc.RpcTimeout.awaitResult(RpcTimeout.scala:83) 
    at org.apache.spark.rpc.RpcEnv.setupEndpointRefByURI(RpcEnv.scala:88) 
    at org.apache.spark.rpc.RpcEnv.setupEndpointRef(RpcEnv.scala:96) 
    at org.apache.spark.deploy.worker.Worker$$anonfun$org$apache$spark$deploy$worker$Worker$$tryRegisterAllMasters$1$$anon$1.run(Worker.scala:216) 
    at java.util.concurrent.Executors$RunnableAdapter.call(Executors.java:511) 
    at java.util.concurrent.FutureTask.run(FutureTask.java:266) 
    at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1142) 
    at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617) 
    at java.lang.Thread.run(Thread.java:745) 
Caused by: java.io.IOException: Failed to connect to master/192.168.1.6:7077 
    at org.apache.spark.network.client.TransportClientFactory.createClient(TransportClientFactory.java:228) 
    at org.apache.spark.network.client.TransportClientFactory.createClient(TransportClientFactory.java:179) 
    at org.apache.spark.rpc.netty.NettyRpcEnv.createClient(NettyRpcEnv.scala:197) 
    at org.apache.spark.rpc.netty.Outbox$$anon$1.call(Outbox.scala:191) 
    at org.apache.spark.rpc.netty.Outbox$$anon$1.call(Outbox.scala:187) 
    ... 4 more 
Caused by: java.net.ConnectException: Connection refused: master/192.168.1.6:7077 
    at sun.nio.ch.SocketChannelImpl.checkConnect(Native Method) 
    at sun.nio.ch.SocketChannelImpl.finishConnect(SocketChannelImpl.java:717) 
    at io.netty.channel.socket.nio.NioSocketChannel.doFinishConnect(NioSocketChannel.java:224) 
    at io.netty.channel.nio.AbstractNioChannel$AbstractNioUnsafe.finishConnect(AbstractNioChannel.java:289) 
    at io.netty.channel.nio.NioEventLoop.processSelectedKey(NioEventLoop.java:528) 
    at io.netty.channel.nio.NioEventLoop.processSelectedKeysOptimized(NioEventLoop.java:468) 
    at io.netty.channel.nio.NioEventLoop.processSelectedKeys(NioEventLoop.java:382) 
    at io.netty.channel.nio.NioEventLoop.run(NioEventLoop.java:354) 
    at io.netty.util.concurrent.SingleThreadEventExecutor$2.run(SingleThreadEventExecutor.java:111) 
    ... 1 more 
16/08/31 14:17:40 ERROR worker.Worker: All masters are unresponsive! Giving up. 

マスターと労働者は、ブリッジ接続を使用して、同じWindows 10ホストにインストールVMWareのVMによってホストされています。

ファイアウォールも無効にしました。

私は何ができますか?

ありがとうございます。ログに

+0

あなたのマスターマシンがあなたのワーカーマシンへのアクセス権を持っているかどうか(単純なping)をチェックしてください。 – Ravikumar

答えて

1

あなたが見ることができます
16/08/31 14:17:03 INFO worker.Worker: Connecting to master master:7077... 

、マスターのホスト名が与えられたIP(192.168.1.6)に解決されることを確認してくださいmaster:7077

を接続しようとしています。

/etc/hostsファイルでホスト名を確認できます。

+0

ホスト名が正しいIPに解決されています。私はホスト名とIPの両方を試しました。答えをありがとう。 –

関連する問題