Exception in thread "main" java.lang.IllegalArgumentException: Fetcher: No agents listed in 'http.agent.name' property.
at org.apache.nutch.fetcher.Fetcher.checkConfiguration(Fetcher.java:1166)
at org.apache.nutch.fetcher.Fetcher.fetch(Fetcher.java:1068)
at org.apache.nutch.crawl.Crawl.run(Crawl.java:135)
at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:65)
at org.apache.nutch.crawl.Crawl.main(Crawl.java:54)
at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57)
at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
at java.lang.reflect.Method.invoke(Method.java:616)
at org.apache.hadoop.util.RunJar.main(RunJar.java:156)
私は毎回./nutch crawl urls -dir crawl -depth 3 -topN 5を実行します。 nutchはこのエラーをスローすることにします。私は両方のnutch-site.xmlを持っています& nutch-default.xmlはで設定しました。Nutch 'http.agent.name'に記載されているエージェントはありません
<property>
<name>http.agent.name</name>
<value>blah</value>
</property>
読みやすくするために説明を取り出しました。しかし、どこでエージェント名を指定できるのか分からない。誰か助言があれば感謝します。
ありがとうございましたこれが問題でした!間違ったファイルを編集しています。 – LinuxBill
メーリングリストが動作していないようです.Nutchメーリングリストを数回購読しようとしましたが失敗しました – janwen