2012-02-03 4 views
0

URLがdb_unfetchedフェーズになった場合。 crawlurlfilter.txtを満たさないURLもdb_unfetched状態になります。Nutch:URLのdb_unfetched状態の基準

  1. たて注入されたURL、
  2. フェッチイマイチURL、
  3. 何らかの例外
にフェッチすることができませんでしURL:

次のURLをDB_ unfetchedとしてマークされている

答えて

3

crawlurlfilter.txtは、URLの取得に適格ではありません。したがって、URLはdb_unfetchedのままです。

関連する問題