2017-03-25 5 views
0

私は、2つのマシン(各マシンに1つの名前ノードと2つのデータノード)からなるHadoopにマルチノードクラスタを持っています。Hadoopのデータノード間のデータのバランスをとるにはどうすればいいですか?

私が使用しています:

hadoop fs -put dir1 hdfspath 

を上記のコマンドで:データは、両方のマシンにのみ一台のマシンに分散されますか?

バランスをとる方法:ハープ・バランサー・ツールを使用するのはどうですか?それとも自動的な方法がありますか?

答えて

0

これは、2つの要因に依存する:あなたはあなたのデータノードに対して定義された

  • ブロックサイズを格納しているデータの

    • サイズ。

    格納されるデータのサイズがブロックサイズを超える場合、データはブロックサイズに分割され、異なるデータノードに格納されます。

  • 関連する問題