私のデータは以下の通りです。パンダで It has three attributes: location, date, and student_id.同値グループyby()。PySparkのカテゴリ値のユニーク()
、Iは、異なる日付で、各位置を表示すること
GROUPBY([ '場所'、 '日付'])[ 'STUDENT_ID']ユニーク()
を行うことができ学生は同時にそこで勉強します。
私の質問は、同じ情報を抽出するためにPySparkで同じgroupbyを実行する方法です。ありがとうございました。
(location, date, student_id)
はあなたが行うことができます: