1
ストリーム全体をファイルに書き込んだり、データフレームにロードしたりしないようにします。正しい方法は何ですか?Spark InputStreamからデータフレームを作成しますか?
ストリーム全体をファイルに書き込んだり、データフレームにロードしたりしないようにします。正しい方法は何ですか?Spark InputStreamからデータフレームを作成しますか?
あなたはあなたの問題がSparkStreaming
のSparkContext
を使用してSparkSession
のsingleton instance
を作成することによって解決することができることを説明しているSpark StreamingとsqlnetworkWordCountを確認することができます。
dataframes
がstreaming rdd
から作成されている場合は、上のリンクを参照してください。
スパークストリーミング? –
https://spark.apache.org/docs/latest/api/scala/index.html#[email protected](path:String,minPartitions:Int):org.apache.spark.rdd。 RDD [String] – Reactormonk
@Reactormonk、このAPIはストリームではなくhdfsのパスを取得します。 – Raytracer