クローンhadoopバージョン2.7.3を設定しました。データサイズを1gから20gまで読み込み、このデータを使用します(それらを操作することができます...)。ただし、クラスタを再起動すると、受け入れることはできません。 私はこのメッセージを持っています: 警告:約×xブロックがあります。ログを確認するかfsckを実行してください。これは、HDFSインストールの一部のブロックに、ライブDataNodeのいずれかに単一のレプリカがないことを意味します。のHDFSファイルがアクセス不能になりますか?
<configuration>
<property>
<name>dfs.namenode.name.dir</name>
<value>file:///home/hduser/hadoop-2.7.3/namenode</value>
<description>NameNode directory for namespace and transaction logs storage.</description>
</property>
<property>
<name>dfs.safemode.threshold.pct</name>
<value>0</value>
</property>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
<property>
<name>dfs.permissions</name>
<value>false</value>
</property>
<property>
<name>dfs.datanode.use.datanode.hostname</name>
<value>false</value>
</property>
<property>
<name>dfs.namenode.datanode.registration.ip-hostname-check</name>
<value>false</value>
</property>
<property>
<name>dfs.namenode.http-address</name>
<value>node1:50070</value>
<description>Your NameNode hostname for http access.</description>
</property>
<property>
<name>dfs.namenode.secondary.http-address</name>
<value>node1:50090</value>
<description>Your Secondary NameNode hostname for http access.</description>
</property>
</configuration>
に
hdfs-site.xml
にこのプロパティを追加する必要があります。つまり、DataNodeがダウンすると、破損したファイル(ブロック不足)が発生します。これはテスト設定ですか?複数のDataNodeを実行していますか? – jeffはい私はただ複数のdataNodesのために使用して、私はちょうどレプリケーションparametresを3に設定し、それは動作しません 、そしていつ私はこのデータをアクセスできないクラスタを再起動します。 – inoubli
safemode.thresholdをより高い値に設定することもできます(デフォルトは0.99)。私の推測は再起動中です。DataNodesはNameNodeでチェックインしていません。セーフモードが無効になっているので、ブロックエラーが発生しています。 – jeff