2011-09-12 8 views
1

「シンボルあたりの平均ビット数」の計算方法について少し混乱します。これは、各文字の確率を取って、それを正規のエントロピーのようなlg(1 /確率)で掛けることによって計算されますか?データ圧縮のためのエントロピーの計算

また、これが真であれば、平均文字の出現状況をどうやって知ることができますか?

答えて

2

私は圧縮について多くを知らないが、私が言うことができるので、私は本当にこの答えるべきではありません。

  • 「シンボルあたりのビットが」定義されている方法は?

正しいですか。 -Σp·log(p)と定義されている通常のエントロピーです。これは実際にはの文字のではなく、のメッセージの頻度であることに注意してください。すなわち、

{ abcdefghijklmnopqrstuvwxyz } 

は偉大なルックスのメッセージの次のセットは、文字ごとに文字を解析していますが、手紙の平均発生が何であるかを知ることができますどのように

  • 0のエントロピーを持っていますか?

メッセージが生成される正確なプロセスがわからない限り、理論的には分かりません。ヒューリスティックを使う必要があります。大きなサンプルを集めて数えたり、冗長性の兆候があることがわかっているパターンを探したりするように。英語のテキストなど

+0

ありがとうございました:-)申し訳ありませんが、これは愚かな質問購入メッセージは0のエントロピーを持っていますか? – rubixibuc

+0

@rubixbucメッセージにはメッセージが1つしかないので、メッセージセットのエントロピーはゼロです。 – Owen

関連する問題