私はすでに知っている多くの人が4月に行っているGSSを利用した、非常に特定のグローバルサイト検索機能を持つサイトで作業しています。私はサイトをクロールして、CloudsearchにXMLを送信する必要がありますが、これについてどうやってどうなるか混乱しています.WS Cloudsearchを使ってインターネット検索を行った後、数日。これまでは、Apache Nutchを使ってサイトをクロールしようと考えていますが、私は本当に入力を感謝します。前もって感謝します!Google Site SearchをAWS CloudSearchに置き換える
答えて
あなたは私たちのブログを見ましたか? Index the web with AWS CloudSearchIndex the web with StormCrawler (revisited)。 NutchとStormCrawlerを使ってAWS Cloudsearchにインデックスを付ける方法について説明しました。
検索が必要な場合は、代わりにElasticsearchとElastic Cloudをお勧めします。私はCloudsearchが遅く、面倒で高価であることを発見しました。また、StormCrawlerとApache NutchのためのElasticsearchのためのより多くのリソースがあります。
Nutchについて言及した最初の記事を読んだことがあります。私は本当にElasticsearchの提案に感謝します。私は現時点ではサイトに取り組み、Google Site Searchの代替案を見つけようとしています。あなたはElastic Cloudがまともな代替品になると思いますか?それは吸うが、それはその特定の市場でGoogleの残酷な空白のように思える。再度、感謝します! –
@EthanStepanianよろしくお願いします。 Elastic Cloudはクロール自体を助けませんが、StormCrawlerと組み合わせると良いアプローチになります。あるいは、Apache SOLRに基づいたホスティングされたソリューションがあり、Nutchのような別のクローラを使うこともできます。 –
- 1. Google Site Search XML APIページネーション
- 2. Wordpress Search Form - "Search"テキストをアイコンに置き換えます
- 3. Google Site Searchを許可するが、Google Botをブロックする
- 4. K8クラスタのAWS ELBの置き換え
- 5. AWS Cloudsearch doc upload url
- 6. bing search api v5 "__next"の置き換えは?
- 7. Google Site Searchの代替品はどれですか?
- 8. GoogleアナリティクスのページビューURLをGoogleタグマネージャに置き換えます。
- 9. AWS CloudSearchエクスポート/データのダウンロード
- 10. CloudSearch for s3 for AWSセッショントークン
- 11. aws cloudsearchでのカスタム検索
- 12. c#プレースホルダをtext.htmlに置き換えて置き換えます。
- 13. ホバーテキストを置き換えて画像に置き換えます
- 14. Googleに表示される404ページを置き換えます。
- 15. Googleシート - 重複するセルを= [セル]に置き換えます
- 16. AWS Cloudsearch上の前のカーソルを取得
- 17. __LINE__マクロを置き換える
- 18. を置き換える ';' '; \ n'
- 19. Googleマップの同じ位置にマーカーを置き換える方法は?
- 20. web.config変換でIIS書き換えルールを置き換える
- 21. Googleスプレッドシートのデータ行をDiagonalに置き換えよう
- 22. 画像の内容をGoogleマップに置き換えます。
- 23. 文字列をgoogleスクリプトの条件に置き換えます
- 24. javascriptでグローバルに置き換える機能を置換する
- 25. Googleマップのタイルピクチャを置き換えるAPI getTileのオーバーライド
- 26. 完全なGoogleスプレッドシートのテキストを置き換える方法
- 27. 二重引用符をスペースで置き換える、Google Apps Script
- 28. alutLoadWAVFileの置き換え
- 29. AWS Lambdaの置き換えinvokeAsync(非推奨)
- 30. エラーをカスタムメッセージに置き換える
あなたはhttp://docs.aws.amazon.com/cloudsearch/latest/developerguide/what-is-cloudsearch.htmlを読んでください。 –
@RicardoC私は過去2〜3日間それらを読んできましたが、文書は私の知識ではクローラの使用を具体的に話しません。 –
Amazon CloudSearchはウェブクローラではありません。 –