私は、最初の種子がフラットファイルで提供されていることを知っています。しかし、これらのURLはどこに注入されていますか?それはcrawlDBですか?その場合、新しいリンクはクローラによって取得され、crawlDBに保存されますか?システムがシャットダウンしたときに何が起きるのですか?crawlDBは次のナッシュ起動時にリフレッシュされますか?Nutch Generatorは初期リンク用にCrawlDBを使用していますか?
実際には、システムシャットダウンの場合には、どこで終了したかを、nutchがクロールを再開したいと思っています。