2016-02-29 9 views
5

リアルタイムで更新されるcassandraテーブルからデータをストリーミングしたいと思います。はい、それはデータベースですが、それを行う方法はありますか?もしそうなら、私はオフセットを保持するか、CQLのクエリを使用できますか?cassandraテーブルからデータをストリームする方法は?

+0

誰もが火花カサンドラ・コネクタは、この中で使用することができます方法についていくつかのアイデアを持っていますか?それはそれ自体でオフセットを処理し、それはほぼリアルタイムでデータをストリームしますか? –

答えて

5

短い答えはいいえ。

長い答えは難しいかもしれませんし、スマートなクラスタリングの鍵は多分そうすることができます。基本的に、常に増加するクラスタリング・キーを使用してデータを挿入すると、最近の時間ギャップでクラスタリング・キーをスキャンすることができます。もちろん、これはあなたの窓の外にあるアウト・オブ・オーダー・インサートを欠場するでしょう。これはあなたのユースケースには十分かもしれません。将来的には

ベストの答えは、チェンジ・データ・キャプチャです:https://issues.apache.org/jira/browse/CASSANDRA-8844

+0

おそらくトリガーですか? –

+0

@RussSリンクのおかげでありがとう –

+0

spark-cassandra-connectorがこれにどのように使用できるかについて誰かが考えていますか?それはそれ自体でオフセットを処理し、それはほぼリアルタイムでデータをストリームしますか? –

関連する問題