0
ここに、私はJSONにデータフレームを書き込むために使用しているコードを示します。私はツェッペリンから、このコードを実行しています:jsonファイルにsparkデータフレームを書き込むことができません。
val df = Seq((2012, 8, "Batman", 9.8), (2012, 8, "Hero", 8.7), (2012, 7, "Robot", 5.5), (2011, 7, "Git", 2.0)).toDF("year", "month", "title", "rating")
df.write.json("/tmp/out.json")
私は何を期待することは/tmp/out.jsonファイルに記述されたデータフレームのデータです。しかしそれは「/tmp/out.json」名前のディレクトリを作成し、その内部で私は2つのファイルが次見つける:これらのファイルのいずれもが、JSONデータを持たないさ
_SUCCESS
._SUCCESS.crc
を。私はここで何が欠けていますか?
ですあなたはクラスタを実行しているのか、それともローカルで実行していますドライバのマシンではなく、エグゼキュータの出力ディレクトリをクラスタでチェックしたことがありますか? – ImDarrenG
@ImDarrenG executorのjsonデータを見ることができます。それはエグゼキュータで分割されます。 1つのjsonファイルですべてのjsonデータを取得する方法はありますか? –
はい、可能です。http://stackoverflow.com/a/40594798/7098262 – Mariusz