豚を使ってhdfsデータをbzip2に圧縮する方法は、最初に持っていたのと同じdir構造を与えるようにしてください。bzip2のhdfsデータを圧縮および解凍するためのスクリプト
私はbzip2で圧縮しようとしましたが、多くのマッパーがスポーンされているため多くのファイルが生成されていましたので、同じdir構造のプレーンテキストファイル(初期形式)に戻すのが難しくなります。
tarballを使用してbzip2を圧縮した後、bzip2.tarを解凍した後は、最初は全く同じデータとフォルダ構造になっています。
例えば圧縮: - タール-cjf compress_folder.tar.bz2 compress_folder/
解凍: - タール-jtvf compress_folder.tar.bz2
がまったく同じディレクトリSTを与えるだろう。