私は、ほぼ静的な200GBの構造化されたクリーンなデータセットをホストするソリューションを探しており、Webアプリケーションでクエリを行うためにデータにJSON APIを提供します。200GBのデータをホストし、JSON APIに集約を提供するソリューション?
私のデータの各行は、次のようになります、と私は約700万行を持っている:
parent_org,org,spend,count,product_code,product_name,date
A31,A81001,1003223.2,14,QX0081,Rosiflora,2014-01-01
データは、ほぼ完全に静的なものである - それは月に一度更新されます。私のような単純な集計クエリをサポートしたいと思います:
- が月によって
、月によって
私は結合を行う必要はありません、私は1つのテーブルがあります。私は(APIを提供するために、ウェブアプリで)のPostgresを使ってきたが、私はインデックス化で何ができるかの限界に到達するために始めていますこれまで
- をしてマテリアライズド・ビューを:私が調査した
ソリューション専用のハードウェアとスキルを持たず、私の持っているスキルとスキルはありません
- Google Cloud Datastore:このサイズの構造化データに適していて、JSON APIは焼き付けられていますが集約はしていません上記の「総支出」クエリ)
- Google BigTable:間違いなくこのサイズのデータを作成できます。集計を実行できます。 App Engineを使用した独自のAPIですか?データをインポートしてhbaseに変換する必要があるかもしれません。
- GoogleのBigQueryは:速い集計で、データ
上記の私のニーズのための一般的な解決策があります場合、私は思ったんだけどをインポートするのは簡単、BigTableのと同じように自分のAPIをロールバックする必要があります。そうでない場合は、このデータをホストしてJSON APIを提供するための最適な設定に関するアドバイスについても感謝します。
更新:ISNので、クエリで払っているので、BigQueryのクラウドSQLのサポートSQLに似たクエリが、クラウドSQLの大きさが十分でないかもしれません(コメントを参照)とBigQueryのは非常に迅速に高価得るようですパブリックウェブアプリには理想的ではありません。データストアは優れた値ですが、集計は行いません。事前集計を行い、複数のテーブルを作成する必要があります。
ここでCloud SQLはオプションですか?サイジングFAQ - https://cloud.google.com/sql/faq#sizeqps –
@SolomonDuskisありがとうございます。それは十分に大きくなるように見えます:)このサイズのデータセットではパフォーマンスが高いでしょうか?または、答えは(Postgresの場合と同様に)「あなたが実際のデータを試してみるまで知らないでしょうか? – Richard
私は分かりません。私はもっと雲の巨大な男、私自身です。クラウドSQLから誰かにチャイムを入れることができるかどうかを見てみましょう。 –