2016-12-28 9 views
1

さて、私はJSON形式であると思われるものを大量に取り込んでいます。私はそれをCassandraクラスターに挿入しようとしています。問題は、データには標準のキーがないことです:value形式なので、実際にはJSONではないと思います。CassandraとJSON

ここではデータの例です:

'{"15151162":"6f0aa7ebc60af9b6dd5992341e155138b3ea369a","15149182":"c141929a6ccc6157f4de7055ea565e7a83f59aea","15144225":"f70a2cdecee0e7e9fe85819e74d0e09d36060909"}' 

は、それでは心の中で、私は思ったんだけど、私は、これは多少の意見ですけど、私は離れてプルする必要があり、その後、大量のデータを挿入するか、ないと維持CQL/Cassandraのいくつかの機能を使って列にマップするより良い方法があります。

また、私たちは約2800万レコードを話していますので、プログラミング言語でオブジェクトを再編成するのではなく、CQL/Cassandraを使ってやりたいと思っています。

私は、Java、C++、SQLに精通しています。これは、nosql/Hybrid nosqlのかなり新しいものです。あなたが鍵を持っていない場合は、GUIDを作成することによって、それを摂取し、そうのようなレコードをフォーマットするよう

おかげ

+0

サンプルデータは有効なJSONです。最近のC *バージョンにはネイティブ[JSONサポート](http://www.datastax.com/dev/blog/whats-new-in-cassandra-2-2-json-support)があります。 JSONを表に挿入すると、キーが列にマップされます。 – Ralf

答えて

0

は、1つを作成します。

{ 
 
    "key": "3fa55ea6-de8b-4b6f-b11e-5a3701982c65", 
 
    "type": "weird data", 
 
    "data": { 
 
    "15144225": "f70a2cdecee0e7e9fe85819e74d0e09d36060909", 
 
    "15149182": "c141929a6ccc6157f4de7055ea565e7a83f59aea", 
 
    "15151162": "6f0aa7ebc60af9b6dd5992341e155138b3ea369a" 
 
    } 
 
}

タイプフィールドを追加すると、次のプログラマは実際にこのデータをデシリアライズしなければならないときに非常に便利です。おそらくバージョンフィールドは良い考えです。

関連する問題