0
私はapache nutchを使用して、rosettacodeでクロールを実行しています。私はウェブサイト全体をクロールしたくない、ちょうど選択されたトピック(例えば、http://www.rosettacode.org/mw/index.php?title=Special%3ASearch&search=Optimization+algorithms&go=Go)をクロールしたい。しかし、私はクロールを実行することができません、それは "私はシードのリストとURLのフィルタをチェックしてください。誰も私はこの問題を解決するのに役立つことができますか?いくつかのトピックでApache nutchを使用してデータをクロールする方法は?
ありがとうございます。 – Rasika