2017-03-11 6 views
0

スパークジョブが短時間(< 10分)ディスクをいっぱいにしています。私は10GBのディスク容量を持っていて、SPARK_LOCAL_DIRSの場所でいっぱいになっています。私の場合、SPARK_LOCAL_DIRSは/ usr/local/spark/tempに設定されています。スパークジョブがSPARK_LOCAL_DIRSの位置にディスクをいっぱいにします。

この入力のようなファイルがたくさんあります(0-1489072623600)。各ファイルのサイズは3MB〜8MBです。

答えて

0

SPARK_LOCAL_DIRSは、rddキャッシュ(ディスク)とシャッフルデータに使用されます。どのくらいの量のデータがキャッシュされているか(ディスク)、ジョブ中にシャッフル操作があるかどうか、ストレージの詳細を確認する必要があります。

+0

どうすれば確認できますか? – user1870400

+0

ストレージを確認できます@ http:// :4040 >>ストレージタブ –

+0

このタブには何も表示されません。 Btw分散ストレージを使用しないでください – user1870400