2012-01-09 4 views
7

データフォルダを見て、私はCFのために次のファイルに気づいた。ごくわずかな質問 - それぞれのファイルは何ですか? 1 ... 6は何ですか? 1〜6のどれにCFの最終(すべて)データが含まれていますか?カッサンドラのデータファイル名の規約

<cf name>-g-1-Compacted 
<cf name>-g-1-Data.db 
<cf name>-g-1-Filter.db 
<cf name>-g-1-Index.db 
<cf name>-g-1-Statistics.db 

... 

<cf name>-g-6-Compacted 
<cf name>-g-6-Data.db 
<cf name>-g-6-Filter.db 
<cf name>-g-6-Index.db 
<cf name>-g-6-Statistics.db 

答えて

9

これらのファイルは、SSTablesに関連するSSTableおよびメタデータです。ここで、各ファイル(Cassandraのソースから持ち上げ:IO/sstable/Component.java)の簡単な説明である

  • Data.db:行のインデックス:sstable
  • Index.dbための基本データsstable
  • Bitidx.dbの含有量についての統計メタデータ:sstable
  • Statistics.dbの行キーのシリアライズされたブルームフィルタ:データファイル
  • Filter.dbにおけるそれらの位置へのポインタとキービットマップセカンダリインデックス:これらの多くはsstableごとに存在する可能性があります
  • 固めた:sstableの準備ができたときに作成され長さ0のファイルは* -Compactedで

SSTablesを削除するには、削除対象としてマークされています。これらのファイルは、JVMがGCを実行するか、Cassandraがシステムのディスク容量が不足していることを検出すると、非同期でクリーンアップされます。

この数字は、スラスタの生成を示します(大きいものは新しいものです)。どちらのデータがすべてのデータであるかにかかわらず、通常の条件では、データは複数のSSTableとメモリに分散されます。 nodetoolを使用して列ファミリをフラッシュした後、大きな圧縮を実行して、そのSSTableのすべてのデータを含む1つのファイルを生成できます(その列ファミリに何も書き込まないと仮定します)。

+0

'Data.db'ファイルには列ファミリのすべてのデータが含まれていることには注意してください。他のすべては、それから生成することができます。 –

関連する問題