x日より古いログファイルを指定のディレクトリで削除するbashスクリプトをビルドしています。あなたが知っているように、 "find"はhadoop fsで利用できないので、私はルビーでこれを行うきちんとした方法を見つけ出し、bashでこれを達成する方法があるかどうか疑問に思っていました。 Rubyでhadoopでx日より古いファイルを削除します。
:
ここ
#!/usr/bin/env ruby
require "date"
five_days_ago = Date.parse(Time.now.to_s) - 5
IO.popen("hadoop fs -lsr /tmp").each_line do |line|
permissions,replication,user,group,size,mod_date,mod_time,path = *line.split(/\s+/)
if (mod_date)
if Date.parse(mod_date.to_s) < five_days_ago
puts line
if permissions.split('')[0] == 'd'
puts "deleting #{path}"
`hadoop fs -rmr -skipTrash #{path}`
dirname = path
next
end
next if path.start_with? dirname
`hadoop fs -rm -skipTrash #{path}`
end
end
end