4
データフレームを列にグループ化しようとすると、各グループの最小値を見つけようとすると、数値以外の列には表示されません。groupbyDatafram.min('timestampCol')
次に、groupbyの最小(最も早い)日付を適切にフィルタリングできますか?Spark groupByデータフレームでタイムスタンプの最小値を求める
私はpostgresql S3インスタンスからデータフレームをストリーミングしているので、データは既に設定されています。
ありがとうございますが、エラーが表示されます。 –
試してみてください: 'import org.apache.spark.sql.functions._' –
本当にすごく残念ですがこれは別の質問ですが、org.apache.spark.sql.DataFrame = [MIN(ts):timestamp]私はそれが単一の列をDataFrameとして返すだけではなく、groupByオブジェクトにcol MIN(ts)を追加すると考えていました。何とかオリジナルのgroupByオブジェクトにこれを参加させる必要がありますか? –