3

指数分布データを圧縮するのに役立つ機械学習アルゴリズム、予測モデルはありますか?私はすでにgolombコードを使用してファイルをエンコードしています。これは間違いなくたくさんのスペースを節約しますが、これでは不十分です。圧縮が必要です。 PAQ8Lは十分に圧縮しません。データ圧縮 - 指数分布の機械学習

必要に応じてファイルをリクエストしてください。

指数分布 -

{A、B、B、A、B、C、C、A、B、A、B、C、B、A、B 、d}

+0

ルーズレス? .... –

+0

ハフマン符号化の変形はおそらく? – biziclop

+0

"PAQ8Lは十分に圧縮していません。"あなたの期待は何ですか?データのサイズはどのくらいあり、どの程度の圧縮率が「十分」ですか?あなたの期待は "到達不能"として高すぎるかもしれません。たぶんあなたは(あなたはたくさんの記憶が必要ですが)cmixを試すことができます:http://www.byronknoll.com/cmix.html。 – flanglet

答えて

1

理論的には考えられません。 Golomb codeは既に幾何学的に分布しているデータに最適です。

+0

そうではありません。 google paq8l;それは私が興味を持っているゴロム符号化された文字列を少なくとも50%圧縮する。はい、間違いなく可能です。 –

+0

はい、私は可逆圧縮が必要です。 –

+0

他の記事で述べたように、PAQ *アルゴリズムはコンテキスト混合アルゴリズムを使用します。つまり、単に指数関数的に分布したデータよりもデータについて知っています。 @ user562688 –

0

他の記事で述べたように、PAQ *アルゴリズムはコンテキスト混合アルゴリズムを使用します。つまり、単に指数関数的に分布したデータよりもデータについて知っています。 指数分布だけがデータに関してわかっているなら、Golombコードはまだ最適だと思います。