私はhadoop 2.xでhdfsのゼロバイトのファイルを削除するコマンドを探しています。 いずれか私は適切なコマンドを教えてください。 私はhdfsで0バイトのファイルを見つけようとしていて、それらをディレクトリから削除しようとしています。ステップバイ0バイトのhadoopファイルを削除します
4
A
答えて
4
for f in $(hdfs dfs -ls -R/| awk '$1 !~ /^d/ && $5 == "0" { print $8 }'); do hdfs dfs -rm "$f"; done
ステップ:
hdfs dfs -ls -R /
- ないディレクトリやサイズを0
for f in $(...); do hdfs dfs -rm "$f"; done
であるそれらのフルパスを印刷する - - 再帰的
awk '$1 !~ /^d/ && $5 == "0" { print $8 }')
は、HDFS内のすべてのファイルを一覧表示し、反復
2
Kombajnの回答に基づいて、たくさんのファイルを削除するとクイーンになるckerはxargs
を使用します。これにより、hdfs
コマンドごとに複数のファイルを削除することができます。これはかなり高価です。
hdfs dfs -ls -R/| awk '$1 !~ /^d/ && $5 == "0" { print $8 }' | xargs -n100 hdfs dfs -rm
関連する問題
- 1. hadoopでx日より古いファイルを削除します。
- 2. 0バイトのファイルは実際に0バイトですか?
- 3. MySQL Intは0を削除します
- 4. 0を削除HIGHCHART
- 5. rails send_fileとsend_dataは0バイトのファイルを送信します
- 6. getObject mockが0バイトのファイルを返しています
- 7. Hadoop - 名前でファイルを削除する方法
- 8. ファイルの途中でバイトを移動せずに削除しますか?
- 9. 0バイトでphpseclibファイルをアップロードする
- 10. 削除大手0
- 11. Curlの操作が0バイトのうち0バイトでタイムアウトしました
- 12. 入力ストリームの最後からNバイトを削除します
- 13. 一時ファイルから特定の画像を削除する[0]
- 14. エンティティフレームワーク4の0..1エンティティを削除/削除する方法
- 15. cv2.videowriterは0バイトのファイル(python)を書き込みます(opencv)
- 16. xp:inputRichText - "ALT 0を押してヘルプ"を削除しますか?
- 17. protobuf MessageToJsonは値0のフィールドを削除します
- 18. Python、Hexは最初の0を削除しますか?
- 19. array.remove(0)複数の要素を削除しています
- 20. 結果のために0を削除します
- 21. KMLファイルを削除して古いKMLファイルを削除する
- 22. System.Net.Mailへの添付ファイルとしてのストリームは0バイトです
- 23. Cloudera Hadoopから指定した日数のディレクトリを削除します
- 24. 0を返した場合は0を削除DateFormat
- 25. svn xxdiffは0バイトのファイルになります。ヘルプ
- 26. Codeigniter:すべてのファイルを削除した後にディレクトリを削除します
- 27. ファイルの1行の3番目の列が0の場合、ファイルを削除しますか?
- 28. File.ReadAllBytes()リターン{バイト[0]}
- 29. Integer.parseIntは先行0を削除します
- 30. SQL削除が0行を返します
ここで使用されているawkスクリプトについて説明していただけますか? – ylabidi
@ylabidiは、Kombajnが述べたものを展開するために、 'd'(ディレクトリ)で始まらず、5番目のフィールド(size)が0でない 'ls 'の行のフィールド8(filename)を表示しています – highlycaffeinated