2つのデータセンターを持つcassandraクラスタを維持しています。今は、既存のクラスタに新しいデータセンターを追加します。データを再構築したら、新しいデータセンターでデータの整合性をどのように確認できますか?cassandraのデータセンター間のデータ一貫性の確認
答えて
各DCからLOCAL_QUORUMで読み取り、比較すると最も単純です。
修復では、圧縮タスクのパーティションのハッシュを構築し、データの読み取りよりも効率的な範囲を比較します。あなたは同じことをするためのツールを作るためにコードからその部分を抜き出すことができます...(もし完全ではない完全な)修復を実行できるのであれば。発見された相違について記録する。
どちらの提案も面白いですね、最初のものはデータセットのサイズに依存し、2番目のものは楽しいプロジェクトのように聞こえます – raam86
完全修復を実行するとIO集中的な作業になります。その他の提案はありますか?私はこれをするために火花の仕事をすることができると聞きました。その上の任意のアイデア? –
スパークジョブはすべてのデータも読み込みます。違いは、すべてのデータを読み込んだ後、修復ジョブは比較対象のデータのマーズツリー(ハッシュ)のみを送信し、スパークはすべてのデータを比較して比較することです。しかし、具体的なことを知りたければ、sparkの仕事やlocal_quorumで読むスクリプトで詳細を知ることができます。 –
- 1. マイクロサービス間のデータ一貫性
- 2. Cassandra DDLの一貫性レベル
- 3. C#リスト間の一貫性
- 4. トランザクションの一貫性とマルチテナント性のためのCassandra対MongoDB?
- 5. バルカン:データの一貫性
- 6. Djangoモデルのデータ一貫性
- 7. 新しいノードを追加するときのCassandraの一貫性の確認方法
- 8. Springデータの一貫性レベルの設定方法Cassandra XMLの設定
- 9. Javascript Date.now()のマシン/タイムゾーン間の一貫性
- 10. 物理マシン間のシードシードの一貫性
- 11. Cassandra 2.2の一貫性とタイムアウトの問題
- 12. Amazon S3のデータの一貫性モデル
- 13. リポジトリ/サービスのパターンとデータの一貫性
- 14. Wordpress WPMUマルチサイトネットワーク間のログイン一貫性
- 15. Djangoでテンプレート間でデータの一貫性を保つ方法は?
- 16. Apache OFBizとCassandraの統合と最終的な一貫性
- 17. Java同期とデータの一貫性
- 18. 2つのデータセンター間のフェールオーバーモードでのCassandraレプリケーションの設定
- 19. タブナビゲーションバーの一貫性
- 20. データの妥当性確認
- 21. cassandra kafka接続元と最終的な一貫性
- 22. cassandraでグローバル一貫性レベルを設定する場所
- 23. PHP - 一貫性
- 24. 2つのモデル間の一意性を確認するレール
- 25. redisでマスターとスレーブ間のデータの一貫性を保証する方法
- 26. FOLモデルの一貫性チェック
- 27. Akka.Netとキャッシュの一貫性
- 28. 一貫性のないアクセス
- 29. PythonコードのSolr一貫性
- 30. {} + "" vs "" + {} - 加算の一貫性
それはどういう意味ですか?データが正しく複製されているかのように? – raam86
古いDCのデータが新しいDCで完全に複製されるようにするにはどうすればよいですか? –