0
私は、2つのマシン(各マシンに1つの名前ノードと2つのデータノード)からなるHadoopにマルチノードクラスタを持っています。Hadoopのデータノード間のデータのバランスをとるにはどうすればいいですか?
私が使用しています:
hadoop fs -put dir1 hdfspath
を上記のコマンドで:データは、両方のマシンにのみ一台のマシンに分散されますか?
バランスをとる方法:ハープ・バランサー・ツールを使用するのはどうですか?それとも自動的な方法がありますか?