2009-07-07 2 views
0

多分、私は問題を間違っていて、答えを質問と混ぜ合わせているのですが、私をここにしてください。私は検索エンジン(lucene/solr、FAST ESPなど)を使用する任意のMVCフレームワーク(PHPやASP.NET MVC、whtever)に基づいたサイトについて(共同で、あなたと) )をモデルのバックエンドとして使用します。つまり、プロジェクト自体にデータベース自体はありません。半構造化されたコンテンツである巨大なドキュメントのインデックス。検索エンジンがモデルであるMVCの実装

私は理解することを望んでいます。サイトは主に読み取り専用であり、トラブルが発生する可能性があります。これは、あなたが行ってから悪い考えだと思うものは何ですか?また、検索エンジンを取り囲むような堅牢なインフラストラクチャが存在することを前提としています。そのため、完全なコメントは歓迎されますが、大きな問題ではないと感じています。

ありがとうございます!

答えて

0

一般に、コンテンツを検索するにはLuceneのようなツールを使用し、検索するにはデータベースを使用します。それがうまくいかないというわけではありません。なぜあなたはデータベースを使いたくないのかという疑問です。はい、それはうまくいくかもしれませんし、それはおそらく機能します(サイトの機能要件に応じて、読んでいます)が、まだLuceneのようなツールを作っていません。rightツールそのものです。

しかし、それはサイトの種類にもよると言われています。それは本当に検索可能なデータだけで、他には何もないサイトか、それ以上のものですか?答えが最初の場合は、良いです!後者の場合は、私が考えることのできるいくつかの問題があります。

  • データを更新するのは面倒なことがあります。 Luceneは索引を再構築しなければならないため、「インスタント更新」は通常は実行されません。これは時間がかかります。データが更新されていない場合は正常です。 1日に2回、または夜間にインデックスを作成するだけで済みます。
  • 索引付けに実際には適していない索引内のデータを埋めることは、通常はお勧めできません。サイトでユーザーがサイトに登録できる場合、そのユーザーデータは実際にはデータベースに格納されます。 luceneインデックスに保存することは不可能ではありません。仕事には適切なツールではありません。索引を索引文書の束として使用しますが、データベースとしても使用しないでください。
+0

ありがとうございましたRazzie - まれに変わることのないカタログからのように、サイトは確かにデータの取得に関するすべてです。しかし、各データ項目の構造は異なるかもしれません。ほんの一握りのテンプレートではなく、任意の「インテリジェントにマークアップされた」XHTMLやXMLの破片のようなものです。実際、CouchDBのようなものも見ていました。ありがとう –

関連する問題