2009-04-10 6 views
2

テキストは、markdown、bbcode、htmlなどのいずれかを使用してデータベースに保存できます。検索条件から許可されたタグを削除する必要がありますか?あなたのマークアップパーサは、そのタスクを支援する方法を持っていますか?マークアップを許可するデータベース列をどのように検索しますか?

私は '%searchword%'クエリのようにを使用するつもりでした。このようなシンプルなテキスト検索では、全文検索で何か利点がありますか?

更新:これを行うには本当に多くの方法があるようです。私はもう少し自分の状況を明らかにするでしょう。会社の求人ウェブサイトでは、約5〜7つのvarcharカラムが検索に利用可能であり(そのうち4つはマークアップを可能にする)、任意の時点で約150の有効な求人情報が掲載されています。

答えて

3

テキストに任意のタイプのマークアップ(HTMLなど)がある場合、インデックス作成や検索中に大きな言語上の正確さが得られないことがあります。その場合は、2つの選択肢があります.1つは、テキストデータをvarbinary(max)列に格納し、ドキュメントタイプを指定してフィルタリングすることです。これがオプションでない場合は、ニュートラルワードブレーカーを使用し、可能であれば、ノイズワードリストにマークアップデータ(HTMLの 'br'など)を追加することを検討することができます。

参照:

代替

+0

良いリンク...非常に多くの選択肢! – dotjoe

2

私はいくつかの外部フルテキスト検索ツール(Luceneなど)を使用します。

1

フィールドのストライプ版を別のフィールドに保存し、フルテキストインデックス検索を使用します。削除されたフィールドはトリガーを使用して最新バージョンに更新されます

関連する問題