サイト全体で検索APIを実装しながら、サイトの静的情報を管理するための最良の方法は何ですか？

最近、Googleは新しいSearch APIを作成し、Googleのアプリエンジンアプリケーションに統合して、サイト内のドキュメントや情報を検索することができます。クール！サイト全体で検索APIを実装しながら、サイトの静的情報を管理するための最良の方法は何ですか？

大量の静的情報を含むかなりの数のDjangoリソースを持つサイトがあります。新しい検索APIを使用して、この情報をサイト全体の検索エンジンに統合したいと考えています。

既存のサイトと多数のテキストリソースがコンテンツに使用されている場合、静的な情報（フラットなHTMLファイル）をサイトのSearch APIデータストアに統合する最良の方法は何ですか？ボーナスに関する質問、このコンテンツを管理する最善の方法は何ですか？サイトに追加のページを追加すると、それらは検索データストアに統合されます。

出典

2012-05-09 RLH

検索APIでは、検索バックエンドにドキュメントを追加して検索する必要があります。静的リソースの場合、これは、検索APIを使用して検索バックエンドにクロールして追加する必要があることを意味します。

アップロードするたびにこの操作を行うことをお勧めします。おそらく最も簡単な方法は、ファイルを走査してタイムスタンプをチェックするcronジョブを作成することです。それらが最後にトラバースされた時よりも新しい場合（もしあれば）、検索バックエンドにそれらを追加/更新する。 cronジョブの代わりに、トラバーサルをトリガするハンドラを定義し、新しいアプリケーションバージョンをデプロイした後でヒットすることもできます。

出典

2012-05-09 15:55:51 schuppe

サイト全体で検索APIを実装しながら、サイトの静的情報を管理するための最良の方法は何ですか？

答えて

関連する問題