2011-10-20 13 views
0

タイトルが示すように、フルテキスト検索でノイズワードを実装する背景にあるロジックは、これらのワードが検索されるのを避けるためのものですか?誰かが「あるべきかどうか」を検索するとどういう意味ですか?結果は表示されませんか? ft_stopword_fileを無効にしようとしているので、誰かが私に論理を教えてもらえると大変感謝しています。フルテキストノイズワード - 論理の背後に

答えて

1

停止語を無効にすると、パフォーマンスが大幅に低下します。この問題を回避するには、PHPコードをチェックして、検索クエリでストップワードが共通しているかどうかを確認し、それらのクエリに「LIKE」検索を適合させるか、単純にsphinxを検索エンジンとして使用します。ストップワードの背後にある論理は、 'is、be、there、not、not'などのような単語の検索を無効にすることです。

2

これらの停止語の理由は、フルテキストインデックスが膨れないようにするためです。パフォーマンスとストレージに役立ちます。すべてのストップワードを含める(または無効にする)と、フルテキスト検索がある程度まで低下します。

+0

私はファイルを変更しない方がいいです。 」これを検索するには? – Shaokan

1

これらの単語は非常に共通しているため、「to」や「be」という単語は非常に一般的でコンテキストレスなので、大きな索引ノードを作成してシステムを劣化させ、ユーザにとって役に立たないということです。

"より良い"のような引用フレーズを見つけるために、より良いインデックス作成方法はngramsですが、この種のインデックス作成は非常にまれです。

関連する問題