2011-12-04 5 views
2

大量のデータを扱うプロジェクトを行っています。私はEc2でそのプロジェクトを主催することを考えています。私はHadoopを使ってコンピューティングを行い、NoSqlシステム(例えばHbase/Cassandra)を使ってデータを保存しようと考えています。 NoSqlシステムは永続的でなければなりません(私は自分のデータを失いたくありません)。私が知る限り、VMをホストしてHadoopとNoSQLをホストする必要があります。しかし、VMは永続的ではありません。データストレージシステムを永続的にホストできる他の方法はありますか(データだけでなく、データを管理するシステム)、Amazonが提供する計算を利用しますか?Amazonで永続的なデータストレージシステムをホストする方法

私のシナリオはデータベースを永続的にホストする人に似ていると思います。

答えて

1

「予約済みインスタンス」と「エラスティックブロックストア」(EBS)を使用する必要があります。

http://aws.amazon.com/ec2/reserved-instances/

http://aws.amazon.com/ebs/

私が正しくあなたの質問を理解していれば、あなたは常にあなたのデータの永続的な記憶のためのEBSボリュームに添付実行しているままにしておくことを予約されたインスタンスをしたいと思います。 EBSはS3にもバックアップ「スナップショップ」を作成することができます。

+0

私が欲しいのは、私がデータを取得することができ、データと実行しているシステムを格納するための永続的な方法を持っていることです。私の理解では、「リザーブドインスタンス」は、私がしばらく(少なくとも1年間)保持できるインスタンスです。そのような場合は、解決策になる可能性があります。ところで、人々は通常どのようにクラウド上でデータベースをホストしていますか? – user1080611

+0

あなたがEC2上のシステムを開発し、あなたが長期間同じインスタンスタイプを使用しようとしているとあなたは少し少ないを支払うことにしたいことを決定するまでリザーブドインスタンスを購入する必要はありません。予約済みのインスタンスを購入することなく、EC2インスタンスを使用することができます。完了する前にインスタンスタイプを変更する可能性があります。 –

+0

AWSは、予約されていないインスタンスを保証するものではありません。あなたのオンデマンドインスタンスが "起動"を得ることは非常にそうではありませんが...私の理解からはどちらも問題ではありません。私がここに間違っているなら、私を訂正してください。 –

0

Amazonでは、データを永続的かつ柔軟に格納するために使用できるSimpleDBという名前のサービスを提供しています。データの要件に応じて、Amazon S3を使用することもできます。