0
は、我々は次のようにgroupBy
とイベント時間にウィンドウ操作を行うことができます。spark.sql.Dataset.groupByKeyは、groupByのようなウィンドウ操作をサポートしていますか?スパーク構造化されたストリーミングで
import spark.implicits._
val words = ... // streaming DataFrame of schema { timestamp: Timestamp, word: String }
// Group the data by window and word and compute the count of each group
val windowedCounts = words.groupBy(
window($"timestamp", "10 minutes", "5 minutes"),
$"word"
).count()
groupByKey
は、ウィンドウ操作をサポートしていますか?
ありがとうございました。