2012-02-15 7 views
0

でクロール:IOExeption最後に、私は例外下記の悪い、悪いを持って... Nutchの(1.4)とクロール1日後Nutchの

. 
. 
. 

-finishing thread FetcherThread, activeThreads=0 
-activeThreads=0, spinWaiting=0, fetchQueues.totalSize=0 
-activeThreads=0 
Fetcher: java.io.IOException: Job failed! 
    at org.apache.hadoop.mapred.JobClient.runJob(JobClient.java:1252) 
    at org.apache.nutch.fetcher.Fetcher.fetch(Fetcher.java:1204) 
    at org.apache.nutch.fetcher.Fetcher.run(Fetcher.java:1240) 
    at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:65) 
    at org.apache.nutch.fetcher.Fetcher.main(Fetcher.java:1213) 
. 
. 

私はNutchのの20のニュースサイトや入力引数があります:深さ3とのtopN -1 私は私のLinuxのルートディレクトリにラム 4GBのどのように私はこの問題を解決することができますについての十分なスペースがありますか?ありがとう。

答えて

0

私はあなたがこの問題を持っているかもしれないと思う:

我々は状況に対処見つける答えはあなたがディスクスペースのうち、最も可能性が高いだということです/:http://wiki.apache.org/nutch/NutchGotchas

答えがそこに述べて提供しましたtmp。大規模な一時ファイルやHadoopクラスタを使用するために、別の場所、またはおそらくはhadoop.tmp.dir(nutch-site.xmlで設定可能)の別のパーティションを使用することを検討してください。

+0

私は/ tmpに大きなスペースを指定しましたが、何も変更されず、同じ例外が発生します。誤った設定がありますか? – hadi

+0

他に何が間違っているのか分かりませんが、とにかく宇宙を使い果たしていないことを確認できますか?どのくらいのデータがtmpフォルダにあるかを確認し、指定した容量以上のスペースがないことを確認します。 – Kiril

+0

はい、私は約100GBのスペースをLinuxに指定しています – hadi

関連する問題