非常に狭い問題のためにいくつかの既存のソリューションが必要です。我々は気に大規模なデータセット用の分散レプリケートバイナリストレージ
プロパティは以下のとおりです。
- 低読み出しレイテンシ
- は、我々は、GoogleのAppEngineのを試してみました
- スケーラブル(物理的なハードウェアやお金のように、より多くのリソースを追加する機能)
を複製し〜1Mブロブでデータをチャンクしたデータストア。残念ながら、読み込みのレイテンシと価格はそれほど楽しいものではありません。我々が考慮しようとしている
オプションは次のとおりです。
- アマゾンのSimpleDB
- HDFS/HBaseの私たち自身に
- のNoSQL品種(東京タイラント?)MySQLでは
- のBLOB(マニュアルの一部をホスティングしかしシャーディングが行われなければならない)
何かが欠けていますか?私たちは他の選択肢を検討すべきか、あるいは別の選択肢を優先させるべきですか?