2016-07-21 20 views
1

私のHDInsight Hadoop(Linux)クラスタ内のワーカーノードの1つが死んでいます(ハートビートの送信を停止しました)。 HDInsightが修正しようとする可能性はありますか?そうでない場合は、オンラインに戻す方法は何ですか?HDInsight Hadoop(Linux)クラスタでどのようにデッドノードを復旧しますか?

+0

Microsoftに問い合わせることを検討しましたか?ワーカーノードを再起動して問題を軽減することができます。 –

+0

これは時間がかかるプロセスです。私はクラスタを削除して再作成することができますが、これは何度も起こりましたので、迅速な解決策があるかどうかを理解したいと思っていました。クラスタを削除して再作成するには時間がかかるでしょうが、代わりに死んだノードを元に戻すために使用するコマンドがある場合は、再起動などが望ましいでしょう。 – Dhiraj

+1

Azureの問題の場合は、それを再起動するために何もすることはできません。一方、HDInsightの問題であれば、ログを分析することで問題を理解することができます。何かできることがあります。しかし、あなたが説明した症状から、それは晴天の問題のように見え、ノードにアクセスすることさえできないときにノードを再起動することはできません。 –

答えて

1

ノードノードからsshでない場合は、ssh経由でノードにログインします。ノード上でアンバリエージェントを再起動します。 ambari-agentは心拍を送るものです。

+0

しかし、ノードに(SSH)接続することさえできない場合、そのノードでコマンドを実行してからエージェントを再起動することはできません。それは雲(Azure HDInsight)ベースのクラスタです。ノード(ヘッドノードから)にSSHingを試みましたが、接続タイムアウトが発生しました。 – Dhiraj

関連する問題