2017-11-08 12 views
1

各ノードに次のHDFSマウントポイントを持つ3つのノードを含むHadoopクラスタ(HDP 2.6)をセットアップしました。DataNodeディレクトリを削除するときのHDFS動作

  • を/ mnt/datadisk1
  • を/ mnt/datadisk2
  • を/ mnt/datadisk3

だから、私の/etc/fstabファイルには、3つのノードのそれぞれに次のようになります。

/dev/mapper/centos-home /home     xfs  defaults  0 0 
... 
# Here the HDFS Partitions: 
/dev/sdb    /mnt/datadisk1   xfs  defaults  0 0 
/dev/sdc    /mnt/datadisk2   xfs  defaults  0 0 
/dev/sdd    /mnt/datadisk3   xfs  defaults  0 0 

パスもHDFS config(Ambari)dfs.datanode.data.dir = /mnt/datadisk1,/mnt/datadisk2,/mnt/datadisk3に設定されています。

私の質問は次のとおりです。 /mnt/datadisk3私のHadoopノードですか? HDFSが再調整され、このパーティションにあったデータが再複製されますか? /mnt/datadisk3他のノードのパーティションも使用できますか?

各パーティションのサイズは約1 TBです。その後、私のHDFSは3*1TB + 3*1TB + 2*1TB = 8TB、または2*1TB + 2*1TB + 2*1TB = 6TBしかないでしょうか(なぜならdatadisk3のパーティションはすべてHDFSから削除されるからです)。

答えて

2
  • 削除またはそうdatadisk3データなしより利用可能datadisk3との任意の接続、自分なりません

    dfs.datanode.data.dir =/mnt/datadisk1,/mnt/datadisk2,/mnt/datadisk3 
    
    dfs.datanode.data.dir = /mnt/datadisk1,/mnt/datadisk2 
    

    のパスを言及しません。

  • はい、HDFSは、それぞれのパーティションにあったデータを再調整し、(レプリケーションファクタに基づいて)他のブロックにレプリケートします。

(あなたがしてのみ、あなたがデータを再利用することができ試運転と廃棄方法を使用している場合)

  • 何あなたはdatadisk3に格納されたデータを使用することはできません

  • 関連する問題