0
私はグループ化されたデータをaggragateするためにこのコードを使用:Sparkのアレイ<string>とアレイ<String>の違いは何ですか?
val result=union_df.orderBy(desc("timestamp")).groupBy("id").agg(collect_set("region") as "region")
その後、私はデータ型を得た:
org.apache.spark.sql.DataFrame = [id: string, region: array<string>]
array<string>
とArray<String>
間で異なるとは何ですか?マップ機能でarray<string>
を反復処理するにはどうすればいいですか(行にはgetArray
関数はありません)。
'array'と 'string'はScala型ではなく、' DataFrame'の 'toString'によって呼び出される' DataType'の 'toString'呼び出しの結果です。 –