2012-02-14 12 views

答えて

10

は、二重引用符であることを起こる理由をGZIP圧縮は、偶然にできます。

にGZipは、次のような文字列がある場合は圧縮は、例えばのでかもしれない標準的な方法に動作します(それを表現するために#記号を使用することができます)

"Foo", 'bar', "baz"

をあなたは、単一のcharecterとして",を圧縮する可能性を、のような何かに文字列を減らす:あなたが持っていた場合、一方

"Foo#'bar', "baz"

"Foo", "bar", "baz"

あなたは圧縮でき", "bそのような:このように利用できる文字の総数を排除することによって、短い文字列につながる

"Foo#ar#az"

ここでも、いずれかの引用作ることだけであれば、一貫しただとして、問題ではありません。

あなたはこのような小さなファイルをgziping見ることができます
[email protected]:~$ cat 1.txt 
"Foo", 'bar', "baz" 

[email protected]:~$ cat 2.txt 
"Foo", "bar", "baz" 

[email protected]:~$ cat 1.txt.gz 
&▒:O1.txtSr▒▒W▒QPOJ,R▒QPJJ▒R▒(▒P▒ 

[email protected]:~$ cat 2.txt.gz 
<▒:O2.txtSr▒▒W▒QPJJ,▒PUJ\tE▒ 

[email protected]:~$ ls -la *txt* 
-rw-rw-r-- 1 briang briang 20 2012-02-14 16:39 1.txt 
-rw-rw-r-- 1 briang briang 46 2012-02-14 16:37 1.txt.gz 
-rw-rw-r-- 1 briang briang 20 2012-02-14 16:39 2.txt 
-rw-rw-r-- 1 briang briang 41 2012-02-14 16:38 2.txt.gz 

はそれらを減らすことが、二つの生の入力間のgzipの違いを見ているのではなく、サイズを追加します。

は、ここでそれが証明する私のLinuxのコマンドラインからカット+ペーストですコンセプトを獲得します。正規化されたgzipファイルは5バイト小さくなります。

+0

なぜdownvoteですか?正しいのではないですか?それとも復讐投票ですか? ;)いずれかの方法で罰金私と一緒に、私はちょうど私の答えたい:私はdownvoterないんだもののP – PeeHaa

+0

を、私はそれを見つける...怪しげな...単に引用タイプに標準化することにgzipを助けるだろうと。 – Charles

+1

@Charlesすぐにコンテンツを追加します。ダウン投票者は、実際に彼が間違っていることを説明した後、答えを削除した人でした。彼は私のプロフィールを通して下降暴挙を続行した。 – Incognito

関連する問題