皆さん、皆さん、今、私は自分のボット(web crawler)を開発しようとしています。私は、コンテンツを取得するには、このようなボットや何かをスケジュールするためのJBossスケジューラサービスを使用するように考えています:Webクローラーに使用するjBossとEJB3の機能
URL u = new URL("http://www.google.kz");
InputStream in = u.openStream();
私は(正しい道に)効果的に開発するために使用すべきEJB3またはJBossの機能お願いしたいと思います私のボット? 私はEJB3とjBossを初めて使用しています。あなたは、より良いアイデアを持っている場合は
、あなたは右here.I私のJavaのスキルを練習するために検索エンジンを開発しています可能性があり、アカデミックな問題で、私はGoogleの:)
- のjboss-5.1と競合するつもりはありません。 0.GA
- XP
- EJB3
- EclipseのHELIOS
PS私はまだhtmlを解析する方法を決めることはなかったが、私はこのようなことについて考えている。Parse HTML。何をお勧めしますか?
@ Bohzoの権利では、これはあなたがしようとしていることに関連する技術ではありません。彼らはあなたを邪魔することはありませんが、あなたにはあまり役に立ちません。 – skaffman