データを永続化するための要件としてJavaを使用してデータを挿入するCassandra 2.1クラスタが30日間あります。 しかし、これは、墓石のある古いデータを持つファイルがディスクに保存されるため、問題を引き起こします。この結果、必要でないデータによってディスクスペースが占有されます。修復にはこのデータをクリアするのに多くの時間がかかります(単一ノード上で最大3日間) データを削除するより良い方法はありますか?Cassandra - テーブルのTTLとTTLを使用したデータの挿入との違い
私はカサンドラは、あなたがテーブル全体のためDEFAULT_TIME_TO_LIVEプロパティを設定することができますdatastax
でこれに遭遇してきました。通常のTTLでマークされた列と行は、上記のように処理されます。レコードがテーブルレベルのTTLを超えた場合、Cassandraはトムブストーンや圧縮を行わずにすぐに削除します。私は挿入しながら、各時間を設定するのではなく、テーブルレベルでTTLを設定した場合https://docs.datastax.com/en/cassandra/3.0/cassandra/dml/dmlAboutDeletes.html?hl=tombstone
は、データをより効率的に削除されます。 また、ドキュメントはCassandra 3のためのものです。何か利点を得るために新しいバージョンにアップグレードする必要がありますか?
修理ではデータを削除しないでください。本当にTTLの議論に参加するべきではありません。 –