2017-10-02 13 views
0

最初に説明が残念です。行列のrddからデータフレームへ

こんにちは、私はいくつかのデータ(RDDの形で)をデータフレームに変換しようとしていますが、ちょっと複雑です。

私はRDDを持っています:各項目はフィーチャーと呼ばれるマトリックス(リストのリスト)とラベルと呼ばれるリストでROW()です。

このRDDを、各行が単一の機能リストであり、ラベルであるスカラーであるDataframeに変換したいと考えています。あなたが見ることができるように、問題は、RDDの機能が行列ではなくベクトルで構成されているという点で発生します。

おかげで、

+0

私はステップバイステップで、まずあなたのRDDをDFに変換してからDFの操作をします...いいえ? – jgp

+0

Row()の要素を複数の要素に展開する操作は何ですか? –

+0

map、for each ... – jgp

答えて

0
flatMap(lambda row: [(f,l) for f, l in zip(row.feature, row.label)]) 

溶液は、各行の特徴及びラベルをflatMapすることでした。 (RDDで)

関連する問題