私はsensordataを持つCassandra 3.7にテーブル/カラムファミリーを持っています。私はこの表から選択するとCassandraの同じプライマリキーの重複する行/列
CREATE TABLE test.sensor_data (
house_id int,
sensor_id int,
time_bucket int,
sensor_time timestamp,
sensor_reading map<int, float>,
PRIMARY KEY ((house_id, sensor_id, time_bucket), sensor_time)
)
は今、私は同じ主キー、私は不可能だと思った何かのために重複を見つけます。
cqlsh:test> select * from sensor_data;
house_id | sensor_id | time_bucket | sensor_time | sensor_reading
----------+-----------+-------------+---------------------------------+----------------
1 | 2 | 3 | 2016-01-02 03:04:05.000000+0000 | {1: 101}
1 | 2 | 3 | 2016-01-02 03:04:05.000000+0000 | {1: 101}
私は問題の一部は、このデータは、JavaとDatastaxのJavaドライバーを使用して「ライブ」書かれているの両方、およびそれがsstableloaderを使用して別のソースからの過去のデータと一緒にロードされていることだと思います。
これは可能ではありません。 私は、このクラスタに従来のcassandra-cliと接続する方法がありません。おそらく、それは私にcqlshを使って見ることができないものを教えてくれたでしょう。
質問:
*これは既知の状況で発生する可能性がありますか?
* cqlshを使用して、より多くの生データを読み取ることはできますか?具体的には、これらの2つの行の時間を書き込みます。 writetime()関数は主キーやコレクションでは動作できません。
ありがとうございました。
更新:blobAsBigIntを使用して
これはコメント、答えと他のソース
から、私が試したものです*選択は後、カサンドラ・CLIを使用して接続*すべて同じ行
に同じ大きな整数を与えます倹約を可能にすることは可能ですが、テーブルを読むことはできません。これは、3.xの
*はsstabledumpを使用してダンプした後、サポートされていないのです継続中であるが、別の週または2かかると予想;)
...再現するために管理し、日時インサートのBIGINTのインプレースを使用して、いくつかのペテンをしようとしました、あなたは確認することができますcassandra-cliのデータですか? – Nick
いいえ、3.xではcassandra-cliはサポートされていません。私はsstabledumpを行うことができますが、データファイルは膨大であり、そのツールはフィルタリングを提供しません。 –
私はsensor_timeが両方の行で異なっていると思いますが、時間が同じであるかのように切り捨てられて表示されます。カサンドラのメーリングリストにもお尋ねすることができます。 – Nick