私は圧縮し、hdfsからfsにエクスポートするたくさんのファイルとサブディレクトリを含むディレクトリを持っています。Hadoopディレクトリを単一のgzipファイルに圧縮するには?
私はこの質問に出くわした - Hadoop: compress file in HDFS? が、それはファイルのみに関連だし、Hadoopのストリーミングを使用するように思えるとGzipCodecは私のディレクトリとは成功を与えませんでした。
HDFSフォルダを1つのgzipファイルに圧縮する最も効率的な理由は何ですか?
ありがとうございます。
することはできません 'gzip' A:あなたが唯一の迅速な勝利:)
さらに読書のために、恒久的な解決策として、これを使用したくないかもしれません
ご注意くださいUnixのFSでも最初にそれを 'tar/har'やそのようなものに変換してから圧縮を行う必要があります。 – philantrovert
@philantrovertもちろん、そうする方法についてアドバイスはありますか? –
私はapacheを使ってJavaプログラムを書くことを提案したい。それはあなたが調べることができる 'TarArchiveOutputStream'のようなクラスを持っています。 – philantrovert