私はいくつかの事前選出のウェブサイトからいくつかの情報を抽出するためにクローラを作成する必要があります。Googleのアプリケーションエンジンで選択したサイトのWebクローラーを実行していますか?
私はこれがまっすぐ仕事だと知っていますが、これを行うにはGoogleのアプリエンジンを使用することを考えています。
私はこれをNutchに試してもらえますか?
これを実行するにはどのように実行可能ですか?
1)googleインフラストラクチャでクローラをホストしている 2)Nutch + app engine - 可能でしょうか?ただ、nutch docs上かすめる
彼は本質的にゼロからクローラを書くだろうか? – simpatico
@simpaticoええ、多かれ少なかれ。 –