私はApacheのアクセスログをLogstash
から解析し、Elasticsearch
インデックスにインデックスを付けます。私はまた、geoip
とagent
フィールドをインデックスしました。インデックス作成中に私はelasticsearchインデックスサイズが実際のファイルサイズ(ディスク上のスペース)よりも大きい6.7x
であることを観察しました。だから私はこれが正しい動作であることを理解したいのですか、ここで何か間違っていますか?私はElasticsearch 5.0
,Logstash 5.0
とKibana 5.0
バージョンを使用しています。私もbest_compressionを試しましたが、同じディスクサイズを使用しています。これまでに試した設定ファイルの完全な観察結果を示します。Elasticsearch best_compressionが機能しない
私の観察:
ユースケース1:
Apache Log file Size
:211メガバイト
Total number of lines
:1,000,000
Index Size
:1.5GB
Observation
:インデックスはファイルサイズよりも大きい6.7x
です。
ユースケース2:
私はその後、私は同様にそれを試してみました、elasticsearchインデックスを圧縮するためにいくつかの解決策を発見しました。
- Disable `_all` fields
- Remove unwanted fields that has been created by `geoip` and `agent` parsing.
- Enable `best_compression` [ index.codec": "best_compression"]
Apache Log file Size
:211メガバイト
Total number of lines
:1,000,000
Index Size
:1.3ギガバイト
Observation
:
127.0.0.1 - - [24/Nov/2016:02:03:08 -0800] "GET /wp-admin HTTP/1.0" 200 4916 "http://trujillo-carpenter.com/" "Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 5.01; Trident/5.1)"
I:インデックスは、ファイルサイズ
ログファイル形式よりも6.16x
大きいです見つけたLogstash + Elasticsearch Storage Experients彼らはsayiです彼らは、インデックスサイズを6.23xから1.57xに減らしました。しかし、それはかなり古いソリューションであり、これらのソリューションはもはやElasticsearch 5.0
で動作していません。
いくつかのより多くの参照私はすでに試してみました:
- Part 2.0: The true story behind Elasticsearch storage requirements
- https://github.com/elastic/elk-index-size-tests
あなたの目的にのみKibanaの可視化を示しているときElasticseachインデックスのサイズを最適化するために任意のより良い方法はありますか?