RDD APIを使用してこのような列を収集できます。sparkはデータフレームから配列[行]ではなくArray [行]として収集します
df.map(r => r.getAs[String]("column")).collect
しかし、当初はデータセットを使用していたので、APIレベルを切り替えることはできません。 df.select("column).collect
は、演算子が動作しなくなったArray[Row]
を返します。 Array[T e.g. String]
に直接集金するにはどうすればよいですか?
あなたを返しますが、あなたは作品が、私は通常の答えを投稿します場合df.select( "列)の.as [文字列]は、メモリからの書き込み?.collect''みました:) –
選択された列の型の配列、例えば文字列 –