2016-09-29 18 views
2

bin/nutch startserverコマンドを使用してnutchをサーバーモードで起動してテストしました。今、私はnutchを起動することができますか?サーバモードは、(分散環境の)hadoopクラスタの上にあり、nutch REST APIを使用してサーバにクロール要求を提出しますか? 助けてください。分散環境でnutchサーバーを実行する方法

答えて

1

さらなる調査から、分散モードで動作するnutchサーバーが得られました。

ステップ: -

  1. のHadoopは、すべてのスレーブノードに設定されていると仮定する。次に、すべてのノードにnutchを設定します。これは助けることができる:あなたの名前ノードにはhttp://wiki.apache.org/nutch/NutchHadoopTutorial
  2. cd $NUTCH_HOME/runtime/deploy
  3. bin/nutch startserver -port <port> -host <host> 注:ポートおよびホストはオプションです。
  4. その後、RESTを使用してnutchからリクエストを送信できます。あなたが提出要求はNutchのサーバーによって受け付けられます:)

    をクロールステップ3.

ハッピーで開始

関連する問題