Big file compression with pythonは、例を使用する方法に関する非常に良い例を示しています。 bz2は純粋にPythonで非常に大きなファイルセット(または大きなファイル)を圧縮するためのものです。Pythonで並列gzip圧縮を行うにはどうすればよいですか?
pigzは、並列圧縮を利用するとより効果的だと言います。 純粋なPythonコードでは、私の知る限り(そしてGoogle検索)、私はPythonと同等の機能を見つけることができません。
pigz
相当の並列Python実装がありますか?
標準ライブラリの圧縮モジュールは、純粋なpython *ではありません。それらを調べると、共有ライブラリ(Cで書かれています)へのインターフェイスであることがわかります。 –
そして、おそらく 'gzip'をリタイアする時が来ました。新しい 'zstd'圧縮は、gzipよりも[一般的に高速です](http://rsmith.home.xs4all.nl/miscellaneous/evaluating-zstandard-compression.html)、圧縮ファイルは小さくなります。 –
@RolandSmith:もちろん、 Pythonインタフェースもありません。それは 'gzip'よりも速く見えますが、" compress faster "というオプションがたくさんあります。互換性の問題のおかげで、 'gzip'は少なくとも部分的には固執します。 10年以上前のハードウェア/ソフトウェアを持つシステムで解凍することができます。デフォルトでは、おそらくインストールされています( 'bz2'がほぼ普及していて、' xz'がそこに届いています)。データを多くの関係者に配布するには、移植性と圧縮率がスピードよりも重要です。一時的な圧縮の場合、速度はしばしば圧縮率に勝るので、 'lz4'または' lzo'は 'zstd'を上回るかもしれません。 – ShadowRanger