デフォルトでは、EMRジョブの実行中に、インスタンスはマッパーよりも少ないリデューサを持つように設定されています。しかし、レデューサーは余分な記憶を与えられていないので、同じ量を持つことができるはずです。 (例えば、超大型の高CPUインスタンスには7つのマッパーがありますが、2つのリデューサーのみですが、マッパーとリデューサーの両方に512 MBのメモリを使用できます)。なぜEMRインスタンスにはマッパーと同じ数のレデューサーがありますか?
これはなぜ、私はマッパーと同じくらい多くのレデューサーを使用するように指定することができますか?
編集:私は間違っている量を持っていた、それは512メガバイトだ
私は今理解していると思いますが、わかりません。 http://docs.amazonwebservices.com/ElasticMapReduce/latest/DeveloperGuide/HadoopMemoryDefault_AMI2.htmlにリストされているメモリ量は、すべてのマッパーまたはすべてのレデューサーにわたっています。すべてが同じJVMで実行されるため、レデューサーごとではありません – dspyz