0
私はこのような何かを達成しようとしています。次のコードスニペットはPig Latinのものです。とにかく私はスパークで同じことをすることができますか?スパークグループby - ブタ変換
A = load 'student' AS (name:chararray,age:int,gpa:float);
DESCRIBE A;
A: {name: chararray,age: int,gpa: float} DUMP A; (John,18,4.0F)
(Mary,19,3.8F) (Bill,20,3.9F) (Joe,18,3.8F)
B = GROUP A BY age;
Result: (18,{(John,18,4.0F),(Joe,18,3.8F)}) (19,{(Mary,19,3.8F)})
(20,{(Bill,20,3.9F)})
ありがとう。
データフレームは本当に必要ですか?あなたが(年齢、(人))のRDDを作成した場合、それは単純なグループByKeyです –