2017-02-11 4 views
0

EMRにはサービスがありますか?または、私は寄木細工のファイルをS3に作成する仕事を提出するときに進行状況バー(または経過時間)を見ることができますか?EMR Spark - S3へのファイル書き込みの進捗状況を確認するにはどうすればよいですか?

コード:

df.write.partitionBy("date").mode("append").parquet("s3n://uk-adp-vault/semasio/output") 
+0

私の経験から、このように新しいデータを追加しないでください。ランタイムは、s3上の既存データの量とほぼ線形です。これを参照してください:http://stackoverflow.com/questions/40830152/how-to-avoid-reading-old-files-from-s3-when-appending-new-data s3-dist-cpを使用するとわかりますリソースマネージャ(http:// :8088/cluster)の進捗状況 – Niros

+0

Nirosが示唆していることは正しいとはいえ、ジョブの進捗状況はSpark UI – eliasah

答えて

0

あなたはEMRの8088ポートを使用してのResourceManagerに行くことができます。これにより、メモリ使用率が表示されます。

そこから、クラスタのスパークUIであるApplicationMasterに移動できます。それはあなたに各仕事の詳細とその仕事の進捗状況を表示します。

関連する問題