2016-08-25 6 views
0

キースペース内の列ファミリから同じデータセンター内の別のキースペースにデータをコピーしています。 cf sizeかnoかを確認したいと思います。コピーされたレコードのコピー元cfと同じです。 クラスタ全体でcfのサイズを測定する方法はありますか?Cassandraの異なるキースペースにあるキースペースの1つのテーブルからテーブルにコピーされたデータを検証する方法は?

答えて

1

AFAIK Cassandraは、テーブルごとまたはクラスタごとの行数を維持しません。一般に、データセットのサイズによって異なります。

  • 小さなデータセット:実行select count(*) from <table> limit <max_number_of_rows>
  • 大きいデータセット:行をカウント次に、CSVファイルにテーブルをダンプするcqlsh copyを使用する:すべての行
  • に大きなデータセット、第2の方法をカウントし、(ページング付き)すべてのテーブルを通してスキャンCassandraのドライバを使用してスクリプトを書きます。
  • 非常に大きなデータセット:クラスタ全体に負荷を分散するためにSpark + Cassandraコネクタを使用します。
関連する問題