0
こんにちは、私はPysparkストリーミングが初めてです。Pysparkストリーミング変換エラー
numbers0 = sc.parallelize([1,2,3,4,5])
numbers1 = sc.parallelize([2,3,4,5,6])
numbers2 = sc.parallelize([3,4,5,6,7])
stream0 = ssc.queueStream([numbers0, numbers1, numbers2])
stream0.pprint()
ssc.start()
ssc.awaitTermination(20)
ssc.stop()
これは、すぐに私はエラーを取得する次の手順を実行して正常に動作しますが、私が欲しいもの
stream1 = stream0.transform(lambda x: x.mean())
stream1.pprint()
ssc.start()
ssc.awaitTermination(20)
ssc.stop()
は私の前のストリームの平均値で構成されていることをストリームです。 誰かが私が何をしなければならないか知っていますか?
ようforEachRDD出力動作の内部でこれを行うと、エラーは何ですか? –
このように変換を使用すると、各RDDの手段である3つのエントリが得られます。 –