0
sparkを使用してJSONファイルを書き込もうとしています。値としてnull
を持ついくつかのキーがあります。これらは、DataSet
でうまく表示されますが、ファイルを書き込むと、キーがドロップされます。それらを確実に保持するにはどうすればよいですか?ソースからJSONデータのsparkでJSONを書き込むときにnull値を持つキーを保持
ddp.coalesce(20).write().mode("overwrite").json("hdfs://localhost:9000/user/dedupe_employee");
部:
コードは、ファイルを書き込む
"event_header": {
"accept_language": null,
"app_id": "App_ID",
"app_name": null,
"client_ip_address": "IP",
"event_id": "ID",
"event_timestamp": null,
"offering_id": "Offering",
"server_ip_address": "IP",
"server_timestamp": 1492565987565,
"topic_name": "Topic",
"version": "1.0"
}
出力:上記の例キーaccept_language
、app_name
とevent_timestamp
において
"event_header": {
"app_id": "App_ID",
"client_ip_address": "IP",
"event_id": "ID",
"offering_id": "Offering",
"server_ip_address": "IP",
"server_timestamp": 1492565987565,
"topic_name": "Topic",
"version": "1.0"
}
が落ちた。