2010-12-15 3 views
2

挨拶、私は入力と比較してzlib(gzip)アルゴリズムの出力を分析しようとしています。辞書サイズ、部分文字列のランレングスペア、元の平文のどこに対応するものかを決定します。私はzlibを使用して、非常に小さなチャンク(それぞれ1K未満)を交換しています。辞書のオーバーヘッド、辞書のエンコードされた平文の割合、結果の辞書のエンコードされた平文の割合などを求めています。zlib/gzipインタープリタ

すばやいグーグルでは結果が得られなかったので、zlibソースコードにデバッグメッセージを挿入して同様の結果を得る前に、ここで質問しています。

このために既製品が既に存在していますか?

+0

播種zlibのは良いアイデアのように聞こえます。 – qdot

+0

ええ、それは一回限りの解決策のためにかなりうまくいきました。私は公共の変更を示すために恥ずかしいだろう! – user17925

答えて

3

http://zlib.net/infgen.c.gzをご覧ください。コード内のコメントから

* Read a zlib, gzip, or raw deflate stream from stdin and write a defgen 
* compatible stream representing that input to stdout (though any specific 
* zlib or gzip header information will be lost). This is based on the puff.c 
* code to decompress deflate streams. Note that neither the zlib nor the gzip 
* trailer is checked against the uncompressed data (in fact the uncompressed 
* data is never generated) -- all that is checked is that the trailer is 
* present. 
+2

こんにちは@Mark、SOにようこそ - ちょうどノート、それはあなたが問題を解決するかどうかのアイデアを持っているので、あなたがリンクしているものの簡単な紹介を提供し、リンク腐敗と戦うために役立ちます。私はあなたの紹介のコメントをこの答えに持ち上げましたが、改善するために自由に編集してください、このリンクがOPに非常に役立つでしょう:) –

関連する問題