私は何百万ものエンドポイントから(ここでは楽観的に)来るであろう少量のセンサーデータのための信頼できる(そしてスピーディーな)ストレージのオプションを探しています。 私が話しているスケールは1Mエンドポイントで、毎分100バイトを送信します。このデータは、この後すぐに分析に使用する必要があります。 さらに、このデータは数年間保持され、合計ストレージが100TBを超えている可能性があります。Amazon S3は何百万ものエンドポイントからセンサーデータストリーミングのストレージとして機能しますか?
S3はこれに対する解決策ですか、それともCassandra/MongoDBなどの独自のNoSQLクラスタをホストする方が良いでしょうか?
私が情報を指定していない場合は教えてください。
経済についての大きなポイント。 OPが求めていることは確かに実現可能ですが、最適なコストを得ることは、経験としか遭遇しない別の手段です。 – Iterator
洞察に感謝します。私がちょうど書き込みコスト(受信データフリー)がないec2ベースのインフラストラクチャでデータを収集していたとすれば、このコストは非常に急峻に見えます。しかし、S3は、単一のユーザーのデータを収集するデータブロブに追加する方法をサポートしていますか?または、受信したデータサンプルごとに1つのファイルを作成する必要がありますか?それは制御から吹き飛ぶだろう..コメント? – user393144
@ user393144 S3は単純なブロブストレージです。既存のファイルに「追加」する方法はありません。あなたのデータが構造化されていれば、データベースに保存するほうがはるかに良いでしょう。従来のリレーショナル・データベースまたは非SQL(例えば、SimpleDB)である。 –