2017-01-22 8 views
0

ES5.xのインデックスには約50億のドキュメントがあります。フィールド名の圧縮に関する情報は見つかりませんでした。ElasticSearch 5フィールド名の圧縮

スペースを節約するために、以前のシステムでは「created_at」ではなく「ca」を使用しています。

ES5.xでフィールド名を小さくする必要がありますか、それとも何とか圧縮されていますか?

Thxを

+0

フィールド名がドキュメントごとにすべて格納されていることに驚いています。すべてのドキュメントに新しいフィールドがある場合、これは意味があります(これがサポートされている場合)。ただし、すべてのドキュメントに同じマッピングタイプがある場合は、フィールド名を最適化する必要はありません。 – Harald

答えて

1

は、あなたが(これは/問題であることに使用される)のMongoDBバックグラウンドを持っていますか?

Luceneのコア貢献者の

Quoting 1に、ストレージはLuceneの仕事ですので、:

整数のIDにフィールド 名を解決し、セグメントごとに単一のファイル(* .fnm)があり、その後、残りの部分インデックスのこれらの整数は IDを使用します。したがって、各フィールドの文字列名の1つのコピーを保持するそのファイルのみが大きくなります。

したがって、フィールド名を短縮する効果は、ごくわずかです。ただし、マッピングに応じて、ElasticsearchのストレージはJSONソースより小さくても大きくてもかまいませんが、マッピングとデータがどれほど良好であるかによって異なります。compressed in Elasticsearch

+0

はい..私たちはWWIIIウィットmongodbを持っています:) ESがフィールド名を短くすれば素晴らしいです。ありがとう.. – Prometheus