2016-06-19 23 views
1

Google Cloud Bigtable(少数のPetaBytes)にかなりの量のデータを格納してサービスします。プライマリキーを使用してデータにアクセスする予定です。キープレフィックスクエリによってデータにアクセスすることもあります。Bigtable/HBase:豊富な列ファミリーと単一のJSONオブジェクト

データの更新は予定されていません。既存のテーブルにのみ追加します。

私の質問をフィルタリング/クエリ/ソートするために私のカラムを使用していないので(Bigtableでは不可能)、データを1つのJSONではなく別々のカラムに格納する利点はありますか行ごとの文書?

ありがとうございます!

答えて

1

カラム単位のデータを取得または更新する予定がない場合は、JSONドキュメントを単一の値として格納する計画は問題ありません。特に、カラム単位のデータを格納すると、 (および修飾子)も各行に格納する必要があるため、値の数に比例するストレージオーバーヘッドが追加されるため、規模が大きくなる可能性があります。モデルでは、Bigtableをキー値ストアとして使用します。

将来的に多くの列にJSONを分割する場合は、実行中のBigtableインスタンスに列ファミリを追加したり、既存の列ファミリ内で追加の列修飾子を使用したりすることができます。 Hadoop MapReduceまたはGoogle Cloud Dataflowのような並列プロセスである。

読み書き速度によっては、30ビッグテーブルノードのデフォルトのクォータを超える必要があります。 Bigtableサーバーノードあたりのパフォーマンスの目安を確認するにはBigtable performance pageを参照してください。ただし、特定の読み取り/書き込みパターンのベンチマークを行い、ベースラインの基準を確立し、それに応じてスケールを調整する必要があります。

追加のクォータが必要で、すでにサポートプランが適用されているGoogle Cloud Platformのお客様の場合は、サポートチケットを開いてください。そうでない場合は、get in touch with usを入力してください。私はGoogle Cloud Bigtableのプロダクトマネージャーです。連絡先フォームを使用している場合は、メッセージに自分の名前を記載して、自分にルーティングされていることを確認してください。あなたはLinkedInを介して私に手を差し伸べることもできます。

あなたのプロジェクトで最高の運があります!

関連する問題