2017-05-24 8 views
0

私はグループ化されたデータをaggragateするためにこのコードを使用:Sparkのアレイ<string>とアレイ<String>の違いは何ですか?

val result=union_df.orderBy(desc("timestamp")).groupBy("id").agg(collect_set("region") as "region") 

その後、私はデータ型を得た:

org.apache.spark.sql.DataFrame = [id: string, region: array<string>] 

array<string>Array<String>間で異なるとは何ですか?マップ機能でarray<string>を反復処理するにはどうすればいいですか(行にはgetArray関数はありません)。

+1

'array 'と 'string'はScala型ではなく、' DataFrame'の 'toString'によって呼び出される' DataType'の 'toString'呼び出しの結果です。 –

答えて

2

配列を返すか、またはgetAs[Array[String]]()getAs[Seq[String]]()

array<string>getAsメソッドを使用することができます内部で使用され、その上にラッパーとArray<String>と同じであるscala.collection.mutable.WrappedArray[String]]あるgetSeq()機能があります。

関連する問題