私は大きなデータとhadoopを初めて使っています。いくつかの学習コースを持って、この絵を見た: なぜhadoopでいくつかのノードを使用する必要がありますか?
これは、単一のマシンを使用すると、進捗ドロドロ速く[最初の1]を作ると言う 我々はいくつかのノードが関与する必要があり、なぜ私は理解できないのですか? =)
私は大きなデータとhadoopを初めて使っています。いくつかの学習コースを持って、この絵を見た: なぜhadoopでいくつかのノードを使用する必要がありますか?
これは、単一のマシンを使用すると、進捗ドロドロ速く[最初の1]を作ると言う 我々はいくつかのノードが関与する必要があり、なぜ私は理解できないのですか? =)
3つのモードで動作するようにhadoopがサポートされている理由は、このブログ「Hadoop Modes」に簡単に説明されています。 はここに秘密がいかに速く動作しますスタンドアロンモード:スタンドアロンモードで
、 バックグラウンドで実行されている一切のHadoopデーモン(名前ノード、データノード、 セカンダリ名前ノード、JobTracker & TaskTracker)はありません。あなたは、
- 名前ノードがメタデータ情報を格納していません。その結果
。
- HDFSが存在しないため、DataNodeはありません。ファイルはハードディスクにローカルに保存されます。
- ステータスを送信するTaskTrackerがJobTrackerを報告していない。
- 管理するTaskTrackerがないため、JobTrackerはありません。
名前が示すように、スタンドアロンモードですべてが単一 JVM(単一のマシン)で実行されます。 プログラムで小さな入力(ローカルに格納されている)のバグをテストする場合に最適です。 LocalJobRunnerモードとして が知られています。 トム・ホワイトによって決定的なガイド:
は、詳細な情報については、本O'ReillyののHadoopをお読みください。
ありがとうございました – reza
続きを読む...;) –