私のHDInsight Hadoop(Linux)クラスタ内のワーカーノードの1つが死んでいます(ハートビートの送信を停止しました)。 HDInsightが修正しようとする可能性はありますか?そうでない場合は、オンラインに戻す方法は何ですか?HDInsight Hadoop(Linux)クラスタでどのようにデッドノードを復旧しますか?
1
A
答えて
1
ノードノードからsshでない場合は、ssh経由でノードにログインします。ノード上でアンバリエージェントを再起動します。 ambari-agentは心拍を送るものです。
+0
しかし、ノードに(SSH)接続することさえできない場合、そのノードでコマンドを実行してからエージェントを再起動することはできません。それは雲(Azure HDInsight)ベースのクラスタです。ノード(ヘッドノードから)にSSHingを試みましたが、接続タイムアウトが発生しました。 – Dhiraj
関連する問題
- 1. HDInsight HadoopクラスタとHDInsight Sparkクラスタの違いは何ですか?
- 2. Cassandra:クラスタはどのようにデッドノードを処理しますか?
- 3. HDInsightクラスタのLinuxディストリビューション情報
- 4. Rを使用してHadoop HDInsightクラスタのHiveデータにアクセスできますか?
- 5. Cassandraクラスタのバックアップと復旧
- 6. NutchはHadoopクラスタでどのように動作しますか?
- 7. psycopg2のトランザクションでエラーからどのように復旧しますか?
- 8. Hadoop - リカバリ専用の障害復旧
- 9. Greendao DBのクローズエラーをどのように復旧できますか?
- 10. Narayana/XAはTM障害からどのように復旧しますか?
- 11. hadoop HDInsightノードの画像/スナップショットを取得してクラスタ作成に使用する方法はありますか?
- 12. HDInsightクラスタを削除できません
- 13. オラクルクラスタノードを復旧します
- 14. 再起動後にCassandraクラスタが復旧していませんか?
- 15. マスタノードに障害が発生した場合、マスタノード上のすべてのデータをどのように復旧でき、どのようにしてhadoopクラスタを再起動できますか?
- 16. BYOC HDInsightクラスタを使用してADFでハイブ活動が失敗する(Linux)
- 17. memsqlアグリゲータが失敗する - クラスタを復旧する方法
- 18. HDInsight HDPクラスタ用にHueをインストールする
- 19. AzureでHDInsightクラスタ上のポートを開く
- 20. 例外復旧後の復旧
- 21. 南部で失敗した移行からどのように復旧する必要がありますか?
- 22. couchbase 2.5.1クラスタからcouchbase 3.0.3クラスタにデータを復元するにはどうすればよいですか?
- 23. hadoopでのディスクまたはデータノードの障害と復旧の手順
- 24. 分散モデルトレーニングのためにhadoopクラスタでどのようにxgboostを実行できますか?
- 25. セッション復旧時にVim、NERDtreeが復旧しない
- 26. Hazelcast - クライアントモード - クラスタ障害後の復旧方法
- 27. git rebaseから復旧しました
- 28. h2o hadoopクラスタのクラスタに接続する
- 29. エラーコード:JA018はHDInsight spark2クラスタのワークフローを実行します
- 30. オープンソースSparkおよびHortonworksのHadoopサンドボックスでクラスタを使用するにはどうすればよいですか?
Microsoftに問い合わせることを検討しましたか?ワーカーノードを再起動して問題を軽減することができます。 –
これは時間がかかるプロセスです。私はクラスタを削除して再作成することができますが、これは何度も起こりましたので、迅速な解決策があるかどうかを理解したいと思っていました。クラスタを削除して再作成するには時間がかかるでしょうが、代わりに死んだノードを元に戻すために使用するコマンドがある場合は、再起動などが望ましいでしょう。 – Dhiraj
Azureの問題の場合は、それを再起動するために何もすることはできません。一方、HDInsightの問題であれば、ログを分析することで問題を理解することができます。何かできることがあります。しかし、あなたが説明した症状から、それは晴天の問題のように見え、ノードにアクセスすることさえできないときにノードを再起動することはできません。 –