今日、私は膨大な量のデータを格納し処理するデータウェアハウスを作成することに挑戦してきました。推定金額は1日当たり7億件を超える。データは7日間保存する必要があります。平均イベントサイズは約0.5〜1Kbです。データを次のように処理する必要があります。大きなデータウェアハウスの選択
- レポートを生成する必要があります。
- 列車モデル。現在
私は評価しています:
- GoogleのBigQueryの
- 赤方偏移
- Stratio +カサンドラ+ AWS + EMR + EBS
- Clouderaの+ AWS
だから私興味がある:
あなたの会社の内部で使用- 溶液(フレームワーク、セットアップ、データベース、ノードの量など)
- 可能管理の複雑さ(DevOpsチーム) 我々が使用
**プロフェッショナルなサーバーまたはネットワーク関連のインフラストラクチャ管理に関する質問**は、プログラミングやプログラミングツールに直接関わらない限り、スタックオーバーフローのトピックではありません。あなたは[Server Fault](http://serverfault.com/tour)に関する助けを得ることができるかもしれません。 –
@MoralesBatovskiそうではありませんが、トピックは大きく、StratioとCloudera社のようなソフトウェアソリューションとフレームワークが関係しています。そしてbigqueryは弾力性があり、APIを介してのみ動作します... –
too broad and offtopic。 –