実行しようとしていますApache Nutchから実行しています。私はhttp://wiki.apache.org/nutch/RunNutchInEclipseの指示に従った。しかし、 "parse-html"(javaとtestの両方)のソースにはエラーがあります。私はとにかくそれを実行し、それがこのエラーを読み取り、URLのseed.txtからとリターンをフェッチ:EclipseのNutchエラー
Fetcher: finished at 2012-03-31 17:21:56, elapsed: 00:00:07
ParseSegment: starting at 2012-03-31 17:21:56
ParseSegment: segment: crawl/segments/20120331172142
Exception in thread "main" java.io.IOException: Job failed!
私は私の目標は、Nutchのからインデックスを取得することであることを指摘したいと、それらを格納しますMongoDB。
私はNutchのドキュメントが最新であるかどうかわからないです。 Linux(またはVM)に向かい、解決してください。たとえあなたがこの問題を解決することができたとしても、ウインドウをつけておけば、もっと先を手に入れられるでしょう。 –
私はすでにUbuntuで働いています。手伝ってくれてありがとう。 –