2017-04-03 12 views
2

私の知る限り、1つのマッパーが1つの分割に割り当てられます。スプリットサイズをmapreduceフレームワークの実際のブロックサイズより大きく設定するとどうなりますか?

しかし、スプリットサイズを実際のブロックサイズより大きくするとどうなりますか?

例:Block size = 128 MbとSplit Size = 130 Mbの場合、これらの場合、いくつのマッパーが実行されますか。 1つのマッパーか複数のマッパーですか?

答えて

0

分割サイズをブロックサイズよりも大きく設定できます。しかしこの場合、1つの分割マッパを得るためには、ブロックnとブロックn + 1が1つのデータノードに位置しないかもしれないので、ネットワーク転送を引き起こす可能性があるhdfsからいくつかのブロックを読むべきです。

例では、splitsize = 130mbを設定し、入力データが130mbファイルの場合、1マッパーを使用します。

+0

これらの場合、1つのマッパーは最初の128メガバイトのデータだけを読み込み、残りの2メガバイトのデータも読み込みます。そうでなければ、一度に130MBのデータ全体を読み込みますか? –

+0

「一度に」とはどういう意味ですか? – fi11er

+0

私は同時に意味します。 –

関連する問題