2016-07-08 8 views

答えて

1

IIUCあなたが試すことができます:

import feather 
import pandas as pd 

#df is spark df 
pdf = df.toPandas() 
feather.write_dataframe(pdf, 'test.feather') 
+0

うん、しかし、理想的に私は、メモリへのデータフレーム全体をアップロードする必要はありません。シナリオ:Sparkでメモリからデータフレーム(特徴抽出)を処理し、フェザーファイルに保存します。次に、ファイルをPython \ Rにアップロードします(おそらく、メモリ量の多い別のマシン)。 –

+0

申し訳ありませんが、私は火花の専門家ではありません。たぶん別の解決策が役立つでしょう。 – jezrael

+0

問題ありません。あなたの答えは私たちがこれまでに持っている解決策です。 –

関連する問題