mysqlに "searchterms"という名前のテーブルがあり、ユーザーが実行する検索用語のデータが含まれています。Apache SOLRのデータインポートハンドラでインデックス付けの誤った用語を無効にする
私はSolrの中にこれらの検索用語をインデックス化し、他のユーザーに基づいて検索するための提案を取得するためのコンポーネントを示唆して使用しています。(それはコミュニティの間で人気検索である)
私は古いデータベースを持っていると私はたくさん持っています古い間違った/スペルミスの検索。
私が正確にやりたいことは、間違った/スペルミスのある用語の索引付けをやめ、正しいスペルの用語のみを索引付けすることです。
私は古いデータをインデックスするためにmysqlに接続されたデータインポートハンドラを使用しています。
この問題の解決方法
を「間違った用語」とは何ですか?あなたは、索引付けすべき唯一の単語か、または除外すべき単語を決定する方法を持っていなければなりません。 – MatsLindh
間違った単語のスペルミスを意味します。 「優先課題」と同じく、「優先課題」と同じです。 このフィールドは、ポータル内のユーザーを介して行われたフレーズのみを検索するので、ユーザーは間違った検索語句を検索することもできます。 –
スペルミスのある単語を特定するには、何らかの方法が必要です。あなたが使用できる単語リストまたは辞書がありますか? Solrには、「これは正しく綴られています」という固有のものはありません。これは、通常、同様のフィールドの用語カウントによって決定されるためです。 – MatsLindh