2016-08-13 3 views
-2

私は大きなデータとhadoopを初めて使っています。いくつかの学習コースを持って、この絵を見た: enter image description hereなぜhadoopでいくつかのノードを使用する必要がありますか?

これは、単一のマシンを使用すると、進捗ドロドロ速く[最初の1]を作ると言う 我々はいくつかのノードが関与する必要があり、なぜ私は理解できないのですか? =)

答えて

0

3つのモードで動作するようにhadoopがサポートされている理由は、このブログ「Hadoop Modes」に簡単に説明されています。 はここに秘密がいかに速く動作しますスタンドアロンモード:スタンドアロンモードで

、 バックグラウンドで実行されている一切のHadoopデーモン(名前ノード、データノード、 セカンダリ名前ノード、JobTracker & TaskTracker)はありません。あなたは、

  • 名前ノードがメタデータ情報を格納していません。その結果

  • HDFSが存在しないため、DataNodeはありません。ファイルはハードディスクにローカルに保存されます。
  • ステータスを送信するTaskTrackerがJobTrackerを報告していない。
  • 管理するTaskTrackerがないため、JobTrackerはありません。

名前が示すように、スタンドアロンモードですべてが単一 JVM(単一のマシン)で実行されます。 プログラムで小さな入力(ローカルに格納されている)のバグをテストする場合に最適です。 LocalJobRunnerモードとして が知られています。 トム・ホワイトによって決定的なガイド:

は、詳細な情報については、本O'ReillyののHadoopをお読みください。

+0

ありがとうございました – reza

+0

続きを読む...;) –

関連する問題