2
データフレームがあり、hdfs上の単一ファイルに保存したい。 スパークデータフレームをhdfs上の単一ファイルに保存
は、私はここで解決 Write single CSV file using spark-csvdf.coalesce(1)
.write.format("com.databricks.spark.csv")
.option("header", "true")
.save("mydata.csv")
が見つかりましたが、すべてのデータが一部-00000/mydata.csvに書き込まれますと私はmydata.csvファイルになりたかったです。
は可能ですか?一時ディレクトリに出力を保存して、要求されたパスにファイルを移動 -
すべてのヘルプは、それが標準スパークライブラリを使用して可能ではないですが、あなたは、ファイルシステムを管理するためのHadoopのAPIを使用することができます
唯一の方法は、私の知る限りでは、この – elmalto
を行うことは可能ではありません前に1つのパーティションに再パーティションすることです! plsは[このリンク](http://stackoverflow.com/questions/40577546/how-to-save-rdd-data-into-json-files-not-folders/40577736#40577736)で答えを確認します。 – mrsrinivas