0
EMRにはサービスがありますか?または、私は寄木細工のファイルをS3に作成する仕事を提出するときに進行状況バー(または経過時間)を見ることができますか?EMR Spark - S3へのファイル書き込みの進捗状況を確認するにはどうすればよいですか?
コード:
df.write.partitionBy("date").mode("append").parquet("s3n://uk-adp-vault/semasio/output")
私の経験から、このように新しいデータを追加しないでください。ランタイムは、s3上の既存データの量とほぼ線形です。これを参照してください:http://stackoverflow.com/questions/40830152/how-to-avoid-reading-old-files-from-s3-when-appending-new-data s3-dist-cpを使用するとわかりますリソースマネージャ(http://:8088/cluster)の進捗状況 –
Niros
Nirosが示唆していることは正しいとはいえ、ジョブの進捗状況はSpark UI – eliasah