0
でクロール:IOExeption最後に、私は例外下記の悪い、悪いを持って... Nutchの(1.4)とクロール1日後Nutchの
.
.
.
-finishing thread FetcherThread, activeThreads=0
-activeThreads=0, spinWaiting=0, fetchQueues.totalSize=0
-activeThreads=0
Fetcher: java.io.IOException: Job failed!
at org.apache.hadoop.mapred.JobClient.runJob(JobClient.java:1252)
at org.apache.nutch.fetcher.Fetcher.fetch(Fetcher.java:1204)
at org.apache.nutch.fetcher.Fetcher.run(Fetcher.java:1240)
at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:65)
at org.apache.nutch.fetcher.Fetcher.main(Fetcher.java:1213)
.
.
。
私はNutchのの20のニュースサイトや入力引数があります:深さ3とのtopN -1 私は私のLinuxのルートディレクトリにラム 4GBのどのように私はこの問題を解決することができますについての十分なスペースがありますか?ありがとう。
私は/ tmpに大きなスペースを指定しましたが、何も変更されず、同じ例外が発生します。誤った設定がありますか? – hadi
他に何が間違っているのか分かりませんが、とにかく宇宙を使い果たしていないことを確認できますか?どのくらいのデータがtmpフォルダにあるかを確認し、指定した容量以上のスペースがないことを確認します。 – Kiril
はい、私は約100GBのスペースをLinuxに指定しています – hadi