JSON文字列をCassandraカラムに効率的に保存するには？

カサンドラ初心者の質問です。私はREST呼び出しを使ってソーシャルネットワーキングサイトからいくつかのデータを収集しています。だから、私はJSON形式でデータが返ってくることになります。 JSONは私のテーブルの列の1つだけです。私はJSON文字列を格納する "ベストプラクティス"が何であるか把握しようとしています。最初にマップタイプを使用すると考えましたが、JSONには文字列、数値タイプなどが含まれています。地図キー/値にワイルドカードタイプを宣言できるようには思えません。 JSON文字列は非常に大きく、おそらくサイズが10KBを超えています。私は潜在的に文字列としてそれを格納することができますが、それは非効率的であるように思えます。私はこれが一般的な仕事だと思うので、これを行う方法に関するいくつかの一般的なガイドラインがあると確信しています。私はCassandraがJSONをネイティブにサポートしていることを知っていますが、私が理解するところでは、JSONマップ全体が1-1のデータベーススキーマと一致するときに使用されます。それは私には当てはまりません。スキーマには一連の列があり、JSON文字列は単なる「ペイロード」の一種です。 JSON文字列をBLOBまたは "テキスト"として保存する方が良いですか？ところで、カサンドラバージョンは2.1.5です。どんなヒントもありがとう。前もって感謝します。JSON文字列をCassandraカラムに効率的に保存するには？

出典

2016-03-31 user2337270

カサンドラストレージエンジンでブロブとテキストの間には大きな違いが実際にそこではない、という欠点を持っている直接

読める人間ではありません基本的にテキストをブロブとして保存します。はい、あなたが話す「ネイティブ」JSONサポートは、データモデルがJSONモデルと一致する場合にのみ使用され、Cassandra 2.2以降のものです。

私はテキストタイプとして保存します。データを送信するとき（または圧縮解除を処理するとき）にJSONデータを圧縮するために何かを実装する必要はありません。 Cassandraのバイナリプロトコルはtransport compressionをサポートしているのでまた、あなたのテーブルには、同じ圧縮アルゴリズムを使用してdata compressedが格納されていることを確認してください（読み込み要求ごとに圧縮する際に保存するために、LZ4を使用することをお勧めします）。したがって、圧縮データの格納とトランスポート圧縮の使用を構成する場合は、どちらかを実装する必要はありません。

使用しているクライアントドライバについては言及していませんが、Datastax Java Client Driverのトランスポート圧縮を設定する方法に関するドキュメントがあります。

出典

2016-03-31 22:13:05 fromanator

ありがとうございます。私はSpring Data Cassandra 1.3.4.RELEASEを使用しています。これにより、Cassandra Driverバージョン2.Xにとどまることができます。私はドライバのバージョンとして2.1.9を使用しています。 Springは、Factoryインスタンスを作成するためのファクトリBeanを提供しています。圧縮をサポートしていないか、Snappyしかないようです。これを指定する方法は、唯一の引数としてEnumをとり、Enumにはこれらの2つのオプションがあります。理由は分かりません。私はそれがサポートされて以来、今はスナッピーで試してみると思います。または、私はSpring Data Cassandraを削除して、クラスタを手動でインスタンス化することができます。 – user2337270

私はCassandraのバネデータのファンではありません。APIはリレーショナルデータベース用に設計されているため、実装の決定には苦労しています。例：CassandraOperations.insert（リスト

JSON文字列をCassandraカラムに効率的に保存するには？

答えて

関連する問題