プロダクションレベルでWeb検索エンジンを作成するためにOpen Search Server http://www.open-search-server.com/を使用します。検索エンジンを作成するための他のGoodフリーソフトウェアはありますか?私は数百万のWebサイトをクロールしたい。プロダクションレベルで検索サーバーを開きますか?
1
A
答えて
4
(開示を構築するために、2つのソフトウェアを使用することができます:この投稿の著者は、ここに記載されたウェブサイト/製品に関連しています)
OpenSearchServerはLuceneに基づいています。さらに、数百万ページの索引付けが可能な強力なWebクローラーも含まれています。私はこのソフトウェアの創始者です。何千ものWebサイトのインデックスを作成するプロジェクトで使用します。
しかし、何百万ものウェブサイトのインデックス作成は別の話です。分散インデックスを構築するには、複数のサーバーにクロールを配布する必要があります。
次に、別のサーバープールを使用して、ユーザーからの検索要求を処理します。 これを行うには、OpenSearchServerのいくつかのインスタンスを使用することができます。
あなたが選んだソフトウェアが何であれ、ハードウェア、特にストレージ部分を慎重に選択する必要があります。大きなインデックスでは、検索クエリのパフォーマンスはストレージのパフォーマンスに関連しています。大きなRAIDプールまたはSSDディスクは大歓迎です。
0
関連する問題
- 1. Ionicモバイルアプリケーションは、プロダクションレベルで無料でビルドできますか?
- 2. FBグラフを開く:オブジェクトフィールドを検索できますか?
- 3. AnnotationViewは検索時に開きます
- 4. サーバーでWebSphere7サーバーの開始/停止履歴を検索する方法
- 5. iphoneアプリでSafariでGoogle Web検索を開きます
- 6. githubネットワークコミットメッセージを検索できますか?
- 7. ハイチャートドーナツ - スライスを開くには、userServiceから検索してページを開きます。
- 8. Azureテーブルストレージで検索できますか?
- 9. 検索バーからDC.jsグラフを検索することはできますか?
- 10. いずれの検索エンジンも検索データを公開していますか?
- 11. odtで検索と置換を行う方法Officeドキュメントを開きますか?
- 12. 弾性検索サービスを開始できません
- 13. スフィンクス検索 - ヘブライ語で検索できないのですか?
- 14. 大きなフォーラムで高速検索機能を開発しますか?
- 15. プログラムでOfficeファイルを開くには、C#を使用してサーバー上で検索しますか?
- 16. Apache Solr検索でインデックスを検索できないが、検索できない
- 17. 検索ウィジェットを使用してandroid:text = "______"フィールドのテキストを検索できますか?
- 18. どのように '%...'を検索してインデックスを検索できますか?
- 19. Tomcat session-cluster:プロダクションレベルですか?それはスケールですか?
- 20. HTML Agility Packサーバーの検索
- 21. .NetとSQLサーバー検索
- 22. AngularJSサーバー側のマルチカラム検索
- 23. SQLサーバー2008高速検索
- 24. SharePoint検索センター:カスタム検索結果ページを表示できますか?
- 25. Powershellがサーバーのオペレーティングシステムを検索する
- 26. のEmacs:I-検索開始検索バッファの初めから
- 27. linux:なぜ/ sys/classを検索できないのですか?/ sysを検索できます
- 28. 検索エンジンはどこからクロールを開始しますか?
- 29. サーバー側からHttpRequestでタイムゾーンを検索する
- 30. Google検索ページを開く
ありがとうございました... –
大きなインデックスでクエリの速度が遅くなるかどうか –
サイズによって異なります。 RAIDまたはSSDを搭載し、16GBのRAMを備えた1台のサーバーは、高速クエリ実行時間(<500ms)で数千万のドキュメントを処理できます。索引付けされたページの総数についてご存じですか? –