私はカサンドラに3つのテーブルをいくつかのノードにクラスタ化し、それぞれの上に座って作業をします。これらのテーブルをA、B、Cと呼ぶことができます。カサンドラスパークDatastaxレプリカ
AとBは巨大ですが、パーティションキーが同じであるため、データの局所性が維持されます。
ここで、別のパーティションキーを持つ他のテーブルCに参加したいと思いますが、他の2つほど大きなパーティションキーはありません。私はすべてのノードにテーブルを複製する準備もできています。
どのようにすれば一緒に参加でき、データの局所性を最小限のシャッフルで維持できますか?
データはあまり巨大ではないので、私は放送に行くことを選んだ。私はあなたの答えをupvoteする15人の担当者を持っていません、申し訳ありません。 – daviddecoding