2016-05-25 3 views
0

に変換する:ために [u'0,1,1,5,0,1382,4,15]PySparkデータフレームがバックIが行ALAにあるデータに依存しているいくつかの既存のコードを持つ行

をいくつかの変換を行うために、私はRDDをデータフレームに変換しなければなりませんでした。これは次のようになります:

行(a = u'1 '、code = u'ts = 12206384'、date = u'2014-10 -05 '、cstat =' 200 '、' substat '= 0、'、time = 0、time = u'00:06:18 'Target = 0)]

スパークDFを元に戻すことは可能ですかそれは私のコードの残りの部分が機能するように元の行形式ですか?

答えて

1

オブジェクトからカンマ区切り値の単一の文字列に戻ってほしいということを意味すると思います。

あなたはオブジェクトが含まれているあなたのデータフレームを取ると、次の操作を行います:あなたのデータフレーム内の各て

df_of_row_objects.map(lambda row: ",".join(x for x in row))

このコードを反復処理をし、カンマで行の各項目を結合します。

関連する問題