私は解析済みのサイトログを格納するためにCassandraを使用しています。私は複数の二次インデックスを持つ2つの列ファミリを持っています。ログデータのサイズは約30 GBです。しかし、cassandraデータディレクトリのサイズは91gです。この店舗の規模を縮小する方法はありますか?また、複数のセカンダリインデックスを持つことは、データストアのサイズに大きな影響を与えますか?Cassandraデータストアのサイズ
2
A
答えて
4
潜在的に、二次インデックスは大きな影響を与える可能性がありますが、明らかにそれはあなたが入れているものによって異なります。ほとんどのデータエントリが1つ以上のインデックスに表示される場合、インデックスはストレージのかなりの部分を占める可能性があります。
各列ファミリがJConsoleおよび/または 'nodetool cfstats'を使用しているかどうかを確認できます。
また、ディスクデータファイルのサイズを見て、使用方法を知ることもできます。
データが十分に頻繁にフラッシュされていない可能性もあります。これは、余分なスペースを占有して、長い時間ディスクにコミットログファイルが残ってしまう可能性があります。これは、列ファミリの一部が軽くロードされている場合に発生します。これを調整するパラメータについては、http://wiki.apache.org/cassandra/MemtableThresholdsを参照してください。
小さな列の数が非常に多い場合は、列の名前がストレージのかなりの部分を占める可能性があるため、タイムスタンプやその他の意味のあるデータではない場合は、短縮する価値があります。 。
関連する問題
- 1. 分散データストア - Hazelcast Vs Cassandra
- 2. GAEデータストアのサイズを移動
- 3. データストア内のエンティティの最大サイズ?
- 4. NoSuchMethodExceptionデータストアを使用しています。cassandra mapper
- 5. CassandraのSSTablesの数とサイズを表示
- 6. Emberjsデータストアの例
- 7. データストアのGet-VIEvent
- 8. GAEデータストア
- 9. Cassandraでオブジェクトのサイズをプログラムで計算する方法
- 10. 既存のデータストアに単一のトークンノードを追加するcassandraクラスタおよびデータ転送が機能しない
- 11. データストア内の結合
- 12. データストアのないバックボーン
- 13. RAMデータストア内のElasticsearch
- 14. クエリーのXMLデータストア - 1
- 15. データストア:入れ
- 16. データストア管理リダイレクトループ
- 17. メッセージングアプリケーション。データストアとメッセージキュー
- 18. サイズNのCassandraクラスタからサイズN +/- Mの別のクラスタにデータを移行する方法
- 19. spark-cassandraのspark-cassandraコネクタとの統合
- 20. Apache CassandraまたはDataStax Cassandra?
- 21. Google App EngineのデータストアのGUI
- 22. Googleのデータストア - キー値のクエリ
- 23. 同種のデータストアのApacheドリル
- 24. ゴーGoogleのデータストアのヌル
- 25. はPowerBuilderがデータストア/オブジェクト
- 26. 仮想ボリュームとデータストア
- 27. Extjs 4データストアとPHP
- 28. アンドロイド配列データストアの問題
- 29. Google App Engineデータストアのリファクタリング
- 30. GAEデータストアとJDOQLのセキュリティリスク
偉大な先端DNAのおかげで!私はいくつかの分析を行い、スナップショットが多くのスペースを取っていることを発見しました。 –
良い点 - nodetoolを使用してスナップショットをローカルおよびグローバルに削除することも、手動で削除することもできます。 – DNA