2011-07-05 13 views
11
Exception in thread "main" java.lang.IllegalArgumentException: Fetcher: No agents listed in 'http.agent.name' property. 
     at org.apache.nutch.fetcher.Fetcher.checkConfiguration(Fetcher.java:1166) 
     at org.apache.nutch.fetcher.Fetcher.fetch(Fetcher.java:1068) 
     at org.apache.nutch.crawl.Crawl.run(Crawl.java:135) 
     at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:65) 
     at org.apache.nutch.crawl.Crawl.main(Crawl.java:54) 
     at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method) 
     at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57) 
     at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43) 
     at java.lang.reflect.Method.invoke(Method.java:616) 
     at org.apache.hadoop.util.RunJar.main(RunJar.java:156) 

私は毎回./nutch crawl urls -dir crawl -depth 3 -topN 5を実行します。 nutchはこのエラーをスローすることにします。私は両方のnutch-site.xmlを持っています& nutch-default.xmlはで設定しました。Nutch 'http.agent.name'に記載されているエージェントはありません

<property> 
    <name>http.agent.name</name> 
    <value>blah</value> 
    </property> 

読みやすくするために説明を取り出しました。しかし、どこでエージェント名を指定できるのか分からない。誰か助言があれば感謝します。

答えて

15

1.3?もしそうなら、ランタイム/ローカル/ confでnutch-site.xml(デフォルトではない)を変更してください。 NUTCH_HOME/confのconfを変更すると、antで再構築しない限りランタイムディレクトリにコピーされません。 なぜあなたはメーリングリストで尋ねないのですか?あなたはもっと助けてくれるでしょう。

+1

ありがとうございましたこれが問題でした!間違ったファイルを編集しています。 – LinuxBill

+0

メーリングリストが動作していないようです.Nutchメーリングリストを数回購読しようとしましたが失敗しました – janwen

0

http.robots.agentsのエージェント名も指定してください。それは私のために働いた。その後私はそのメッセージを手に入れませんでした!

関連する問題