2017-02-13 14 views
0

私は大きなデータ処理のためにHortonworks環境を使用しています。ローカルキャッシュポストマップスペースを取る仕事を減らす

Hive/Oozie/PigなどのMap Reduceジョブの一部として、私の下のローカルキャッシュディレクトリがいっぱいになっていることがわかりました.JARファイルですべてのマップ実行を減らすためのフォルダが1つ作成されます。

/Hadoopの/糸/ローカル/ usercache /ルート/ファイルキャッシュ

私が直接これらのフォルダーを削除した場合、それは大丈夫ですか?自動的に削除するように設定できる設定はありますか?

答えて

1

これらのディレクトリは、600000ms(10分)ごとに自動的にクリーンアップする必要があります。

また、このプロパティをyarn-site.xmlyarn.nodemanager.localizer.cache.cleanup.interval-msに設定することで、この時間を短縮できます。

このキャッシュディレクトリの最大サイズを変更することもできます。 yarn.nodemanager.localizer.cache.target-size-mb。デフォルトのターゲットサイズは10240MBです。

ジョブが実行されていない場合は、キャッシュを手動で削除しても問題ありません。キャッシュを削除した後、nodemanagerを再起動してください。

+0

実際には、これらのエントリは両方ともmy-site.xmlファイルに存在しません。私はそれらを追加し、ユーザーがシステムを使用していないときに真夜中の糸サービスを再開し、すべてのジョブも完了したら再開します。古いフォルダを手動で削除してノードマネージャを再起動することはできますか? –

+0

はい、手動による削除は問題ありません。ジョブが完了すると古いキャッシュは必要ありません。 – franklinsijo

+0

私は変更したのはyarn.nodemanager.localizer.cache.cleanup.interval-msです。糸とノードマネージャーのサービスを再開しました。ただし、フォルダは消去されませんでした。私は何かが欠けていたか? –

関連する問題