私は、Mac上でall-sparkノートブックドッカーの画像を使って、apree toreeとscala(https://github.com/jupyter/docker-stacks/tree/master/all-spark-notebook)を使用しています。私は、スパークのマニュアルの基本的なストリーミングの例をテストしようとしていますScalaスパークストリーミング(Apache Toree経由)
に伴うWICH: 1)ポート9999 2に耳を傾け、sparkstreamingオブジェクトを起動する)ネットキャストプログラム開始:だから私は起動nc -lk 9999
を9999ポートを結合コンテナ:
$ sudo docker run -it --rm -p 9999:9999 -p 8888:8888 -e GRANT_SUDO=yes --user root --pid=host -e TINI_SUBREAPER=true -v $HOME/Informatique/notebooks:/home/jovyan/work:rw jupyter/all-spark-notebook
しかし、その後、それに接続しようと、私は、「ポート使用済み」エラーました:
$ nc -lk 9999
nc: Address already in use
を
私はまた、容器に自分を入れてみました:
[email protected]:~$ docker ps
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
0bd6b70bacfa jupyter/all-spark-notebook "tini -- start-not..." 23 seconds ago Up 22 seconds 0.0.0.0:8888->8888/tcp, 0.0.0.0:9999->9999/tcp wonderful_brattain
[email protected]:~$ docker exec -ti wonderful_brattain /bin/bash
[email protected]:~/work# nc -lk 9999
bash: nc: command not found
[email protected]:~/work# sudo apt-get update
[email protected]:~/work# sudo apt-get install netcat-traditional
[email protected]:~/work# nc -lk 9999
aaaa aaa aaa
bb bbb bbb
cc cc cc
しかし、Scalaのノートブックに表示されるものはありません。
import org.apache.spark._
import org.apache.spark.streaming._
import org.apache.spark.streaming.StreamingContext._
val conf = new SparkConf().setMaster("local[2]").setAppName("NetworkWordCount")
val ssc = new StreamingContext(sc, Seconds(1))
val lines = ssc.socketTextStream("localhost", 9999)
val words = lines.flatMap(_.split(" "))
import org.apache.spark.streaming.StreamingContext._ // not necessary since Spark 1.3
// Count each word in each batch
val pairs = words.map(word => (word, 1))
val wordCounts = pairs.reduceByKey(_ + _)
// Print the first ten elements of each RDD generated in this DStream to the console
wordCounts.print()
で:
ssc.start() // Start the computation
ssc.awaitTermination() // Wait for the computation to terminate
与える:
-------------------------------------------
Time: 1485880101000 ms
-------------------------------------------
-------------------------------------------
Time: 1485880102000 ms
-------------------------------------------
-------------------------------------------
Time: 1485880103000 ms
-------------------------------------------
-------------------------------------------
Time: 1485880104000 ms
-------------------------------------------
これらのネットワークの問題に対処するにはどうすればよいですか?