2009-02-26 2 views
4

私はSQL Serverのフルテキストインデックス作成を使用してアイデアを試しています。仕事には最適だと思うが、私のクライアントが望んでいるのは、非常にGoogleのような結果のサマリーで、検索用語の末尾にのテキストが抽出されて表示されます。SQL Serverフルテキストインデックスから返されたテキストからコンテキストテキスト抽出を生成するにはどうすればよいですか?

私は "家" を検索すると...

My House Is a Very, Very, Very Fine House
...今日の私たちのを訪問に来るためのおかげで...あなたはこの好きではありません.. .hey、​​なぜあなたは私のに火を設定している?...

その検索語が検索が上のヒット何のために完全に一致する場合、これはあまりにも難しいことではありません。あなたは単純にテキストのいくつかの退屈な解析を行い、抽出を生成することができます。

しかし、屈折率とステミングはどうなりますか?私が「歩く」を検索すると、「歩いている」、「歩いている」などの質問が表示されることがあります。何がという単語が検索結果に表示されます抽出。

このエリアは、市販のアドオン製品では熟しているようですが、それとも私が検討していないようなエレガントな方法がありますか?

(そして、はい、私たちは、彼らがこのような場合には動作しない場合がありますなぜ、いくつかの微妙な理由があります。GSAとGoogle Miniのを認識しているので、我々は最初のSQL FTIをしようとしています。)

+0

あなたは今まで問題? – jimmystormig

答えて

1

の場合SQL 2008を使用して、あなたはsys.dm_fts_parserを使うことができると思います。最終的な検索文字列を(FORMSOFなどを追加して)送信してください。これはあなたのページ上のテキストを強調表示するために使用できる単語のリストを返します(強調表示を行うためにjqueryプラグインを使用すると、見つからない単語は強調表示されません)

関連する問題