1
私は2日ごとにファイルを取得するディレクトリをhdfsに持っています。このディレクトリ内のすべてのファイルを別のディレクトリにコピーしたいのですが、新しいファイルが今日入ってくると、そのファイルを複製ディレクトリにコピーします。1つのHDFSディレクトリから別のHDFSディレクトリにデータを連続的にコピーする
これをHdfsでどうやって行うことができますか?
私はLinuxでrsyncを使ってこれを行うことができます。このようなHdfsのメソッドもありますか?
あなたが言うように、 'distcp'' -update'はディレクトリ全体を上書きします。変更のみがあるかどうかを確認する方法はありますか?変更があった場合は、その変更のみを更新してください。 – User12345
いいえ、変更を上書きします。ソースに10個のファイルがあり、宛先にすでに5個のファイルがある場合、distcpは残りの5個だけを書き込みます。この更新フラグは、すでに存在する5つのファイルにも更新があるかどうかをチェックします。存在しない場合は上書きされます。 – franklinsijo