'DataFrame'オブジェクトの修正方法は 'coalesce'属性がありませんか？

PySparkアプリケーションでは、データフレームをパンダに変換してトランスポーズしようとしましたが、その結果をCSVファイルに書きたいと思います。これは私がそれをやっている方法です：'DataFrame'オブジェクトの修正方法は 'coalesce'属性がありませんか？

df = df.toPandas().set_index("s").transpose() 
df.coalesce(1).write.option("header", True).option("delimiter", ",").csv('dataframe')

実行このスクリプトは、私は次のエラーを取得するとき：

'DataFrame' object has no attribute 'coalesce'

問題が何でありますか？どうすれば修正できますか？

問題は、sparkデータフレームをpandasデータフレームに変換したことです。パンダのデータフレームには3210メソッドがありません。 pandas hereのドキュメントを見ることができます。

toPandas()を使用すると、データフレームはすでに収集され、メモリにはの代わりにパンダのデータフレームメソッドdf.to_csv(path)を使用してみます。

2017-09-28 09:05:48 Shaido

問題だったので、修正しました！ –

答えて