wikiのxmlダンプでluceneを使用してウィキペディアの記事の検索エンジンを作成しています。特定のクエリでgoogle wikiの結果と比較したときに、 :en.wikipedia.org "と照会してください。私は複数のクエリのためにそれをやりたいので、私は手動でGoogleの検索結果のURLを取得しています。私はGoogle APIを使用してGoogleを検索しますが、問題は特定のタイプの結果を取り除きたいということです "/カテゴリ:" "/アイコン:" "/ファイル:" "/写真: とユーザーページGoogleの検索結果をフィルタする
しかし、クエリを発行し、n個の結果を取得し、その後正規表現を使用してフィルタを取り除き、その後残りの(nx)結果を取得する反復メソッドを使用する以外は、これを行う便利な方法が見つかりませんでした。そうです。私がそれをするとGoogleは私をブロックし続ける。
私はJavaを使いたいと思うようにGoogleの結果を得るためのインテリジェントな方法はありますか?
ありがとうございました。