1
「シンボルあたりの平均ビット数」の計算方法について少し混乱します。これは、各文字の確率を取って、それを正規のエントロピーのようなlg(1 /確率)で掛けることによって計算されますか?データ圧縮のためのエントロピーの計算
また、これが真であれば、平均文字の出現状況をどうやって知ることができますか?
「シンボルあたりの平均ビット数」の計算方法について少し混乱します。これは、各文字の確率を取って、それを正規のエントロピーのようなlg(1 /確率)で掛けることによって計算されますか?データ圧縮のためのエントロピーの計算
また、これが真であれば、平均文字の出現状況をどうやって知ることができますか?
私は圧縮について多くを知らないが、私が言うことができるので、私は本当にこの答えるべきではありません。
正しいですか。 -Σp·log(p)
と定義されている通常のエントロピーです。これは実際にはの文字のではなく、のメッセージの頻度であることに注意してください。すなわち、
{ abcdefghijklmnopqrstuvwxyz }
は偉大なルックスのメッセージの次のセットは、文字ごとに文字を解析していますが、手紙の平均発生が何であるかを知ることができますどのように
メッセージが生成される正確なプロセスがわからない限り、理論的には分かりません。ヒューリスティックを使う必要があります。大きなサンプルを集めて数えたり、冗長性の兆候があることがわかっているパターンを探したりするように。英語のテキストなど
ありがとうございました:-)申し訳ありませんが、これは愚かな質問購入メッセージは0のエントロピーを持っていますか? – rubixibuc
@rubixbucメッセージにはメッセージが1つしかないので、メッセージセットのエントロピーはゼロです。 – Owen