2017-07-07 7 views
3

私は呼び出すことによって(スパークRDDから作成された)リストから作成したパンダのデータフレームがあります。タプルのパンダデータフレーム?

newRdd = rdd.map(lambda row: Row(row.__fields__ + ["tag"])(row + (tagScripts(row),))).collect()、その後df = pd.DataFrame(newRdd)

下記のように私のデータはタプルのデータフレームのように見える終わるを:

0 (2017-06-21, Sun, ATL, 10) 
1 (2017-06-21, Sun, ATL, 11) 
2 (2017-06-21, Sun, ATL, 11) 

が、私はそれのような列ヘッダーを標準テーブルのように見える必要があります。

date  dayOfWeek airport val1 
2017-06-11 Sun   ATL  11  

私は正直なところこのアイデアから外れていて、助けが必要です。私はいろいろなことを試みましたが、何も動作していないようです。どんな助けでも大歓迎です。あなたの時間をありがとう。

+0

newRddの形式は何ですか?おそらくそれの印刷物を表示してください... –

+0

それはリストのオブジェクトタイプです –

+0

そしてそれは一度それがpandasデータフレームタイプ –

答えて

2

あなたはこのようにそれを行うことができます。

df = pd.DataFrame([*df.A],columns = ['date','dayOfWeek','airport','val1','val2','val3','val4','val5','val6']) 

は、私はあなたが既に持っているデータフレームの列名を仮定は Aです。

hereでタプルの開梱を確認できます。

希望しました。ご質問がありましたらお知らせください。

関連する問題