私はちょうど弾性地図は、サンプル・アプリケーション減らす走った:「Apacheのログ処理」をパフォーマンスへの影響は、スケールアウト対スケールアップのために削減シナリオの
デフォルト:私はデフォルトの設定で走った (2つの小型コアインスタンス) - それは19分
を取っスケールアウト: はその後、私は設定して、それを実行しました: - : はその後、私は設定して、それを実行しました:2つの大型コアインスタンス8つの小型コアインスタンスそれは18分
スケールアップしましたそれは14分かかりました。
大規模なデータセットを使用している場合、スケールアップのパフォーマンスとスケールアウトについて考えてみましょう。
ありがとうございました。
m1.largeおよびm1.xlarge? – yura
はい、ありがとう!私は私の答えを編集しました。私は最近、c1.xlargeがCPU集約型の操作には良いかもしれないこと、そしてm2.2xlargeが(UniqValueCount操作のような)メモリー集約型操作に適していることも発見しました。 – Suman
私は大規模なログ処理のために "Cluster Compute Eight Extra Large Instance"まで同様の実験を行った。大きなインスタンスのほうがコスト効率が高いと思われます。つまり、クラスタユニットは小規模インスタンスの4倍安いです。 – yura