DataFrame df
の列にcolumn
があり、column
をベクトル(たとえばDenseVector
)に変換してベクトルと行列の製品で使用できるようにしたいと考えています。Spark:DataFrame列をベクトルに変換する
注意:ベクトルの列は必要ありません。私はベクトルオブジェクトが必要です。
これを行う方法?
vectorAssembler
関数()が見つかりましたが、これは一部のDataFrame列をベクトル列に変換するため、これはまだ役に立ちません。これはDataFrame列です。私の望む出力は代わりにベクトルでなければなりません。
希望の出力とともにいくつかのサンプルデータを提供してください – desertnaut
https://stackoverflow.com/questions/42138482/pyspark-how-do-i-convert-an-array-ie-list-column- to-vector – MaFF
私はこれが重複しているとは思わない。私がうまく理解していれば、この他の投稿はDF列の型を変換しようとしています。私はむしろDFから列を抽出してベクトルに変換する必要があります。これはもはやDFの列ではありません。 –