2012-04-16 6 views
0

私はちょうど弾性地図は、サンプル・アプリケーション減らす走った:「Apacheのログ処理」をパフォーマンスへの影響は、スケールアウト対スケールアップのために削減シナリオの

デフォルト:私はデフォルトの設定で走った (2つの小型コアインスタンス) - それは19分

を取っ

スケールアウト: はその後、私は設定して、それを実行しました: - : はその後、私は設定して、それを実行しました:2つの大型コアインスタンス8つの小型コアインスタンスそれは18分

スケールアップしましたそれは14分かかりました。

大規模なデータセットを使用している場合、スケールアップのパフォーマンスとスケールアウトについて考えてみましょう。

ありがとうございました。

答えて

0

私はそれが依存すると言います。私は通常、m1.largeとm1.xlargeのインスタンスを使用して、処理速度のほうがはるかに優れていることがわかりました。あなたが気づいたように、それ以外の場合、同じ仕事はおそらく、償却されたか、正規化されたインスタンス時間と同じです。

ジョブの場合は、最初に小さいサンプルデータセットを試して、どれくらいの時間がかかるかを確認し、大きなデータセットを使用して完全なジョブを完了するまでに要する時間を見積もることができます。私はそれが就職のための時間を見積もる最良の方法であることがわかった。

+1

m1.largeおよびm1.xlarge? – yura

+0

はい、ありがとう!私は私の答えを編集しました。私は最近、c1.xlargeがCPU集約型の操作には良いかもしれないこと、そしてm2.2xlargeが(UniqValueCount操作のような)メモリー集約型操作に適していることも発見しました。 – Suman

+0

私は大規模なログ処理のために "Cluster Compute Eight Extra Large Instance"まで同様の実験を行った。大きなインスタンスのほうがコスト効率が高いと思われます。つまり、クラスタユニットは小規模インスタンスの4倍安いです。 – yura

関連する問題