2017-06-14 9 views
1

ストリーム全体をファイルに書き込んだり、データフレームにロードしたりしないようにします。正しい方法は何ですか?Spark InputStreamからデータフレームを作成しますか?

+0

スパークストリーミング? –

+0

https://spark.apache.org/docs/latest/api/scala/index.html#[email protected](path:String,minPartitions:Int):org.apache.spark.rdd。 RDD [String] – Reactormonk

+0

@Reactormonk、このAPIはストリームではなくhdfsのパスを取得します。 – Raytracer

答えて

1

あなたはあなたの問題がSparkStreamingSparkContextを使用してSparkSessionsingleton instanceを作成することによって解決することができることを説明しているSpark StreamingsqlnetworkWordCountを確認することができます。

dataframesstreaming rddから作成されている場合は、上のリンクを参照してください。

関連する問題