2
私はレコードのリスト/配列を持っていますが、私はexplode
を使ってリストからデータを抽出しています。私は、JavaでSpark SQLを使用して、展開された結果から最初のレコードを選択したいと思います。グループから最初のレコードを選択する方法は?
Dataset<Row> ds= ds.select(
json.col("*"),
explode(json.col("records.record.newrecord")).as("newrecord"));
ds= ds.select(ds.col("EVENT_SEQ"), ds.col("newrecord").apply("event").as("EVENTTYPE"));
現在のデータ:
| EVENT_SEQ|EVENTTYPE|
+--------------------+---------+
|5a694d77-bc65-4bf...| 0|
|5a694d77-bc65-4bf...| 0|
+--------------------+---------+
要件:
| EVENT_SEQ|EVENTTYPE|
+--------------------+---------+
|5a694d77-bc65-4bf...| 0|
+--------------------+---------+
私は、この目的のためにCloumn.apply
ことを示唆しているドキュメントを見てきましたが、私は私が始めるのに十分な助けを発見していません。