2017-03-14 8 views
0

デプロイモードでNutchを実行すると、Hadoopに基づいて分散クロールが行われることがわかりましたが、ローカルモードで実行するタイミングを完全に理解できませんでした。この場合、NutchはHadoopから独立していますか? MapReduceに基づいていないローカルモードでのクロールプロセスはありますか?NutchはローカルモードでHadoopとは独立していますか?

答えて

2

NutchはMapReduceをベースにしています。 HadoopライブラリはNutchの依存関係で、ローカルモードでNutchはHadoop関連のライブラリをクラスパスに置き、すべてを単一のJVMで実行します。分散モードでは、 'hadoop'コマンドが呼び出されます。

Nutch script
PSを参照してください:あなたは、単一のマシン上のNutchを使用している場合、それはあなたがMapReduceのUIがクロール+並列処理などを監視するために得るように疑似分散モードでそれを実行するために理にかなって...

+0

[OK]を。したがって、ローカルモードでは、NutchはHadoopのMapReduceメカニズムだけを使用します。私は正しい? –

+0

「その他のもの」 - > HDFS?デフォルトでは使用されません。私たちはNutch 1.x BTWについて話していますか? –

+0

はい私は1.12で作業しています。スタンドアローンモードでHDFSを使用するには? –

関連する問題