私はしばらくの間ElasticMapReduceを使用しました。非常に便利ですが、Hadoopクラスタは一時的にしか利用できないため、HBaseを実行することはできません(私はHBase and Hadoopに多少関連する質問をしました)。EC2対ElasticMapReduce/S3のHadoop
したがって、EC2マシンのセットにHadoopをインストールしてみたいと思います。 HadoopにはEC2関連のディレクトリsrc/contrib/ec2があります。 Hadoopクラスタは単にコマンドを入力するだけで起動でき、ジョブなどを実行するためにマスターノードにログインすることができます。これを試す前に、私はこれを使ってきたpplからの問題を知りたい。ありがとう!
良い質問ですが、何か答えを見るのも大好きです。 Elastic MapReduceはストレージプラットフォームとしてS3を使用していることがわかっていますので、通常はEC2のHadoopよりも効率が悪いです。なぜなら、HDFS(s3は別のシステムで動作します)のようにデータローカリティの最適化を使用できないからです。 – Christophe