検索のためのsolrを持つDrupalサイトです。主に私は現在の中国語の検索結果に満足していません。トークナイザは単語を小さな小片に分割しました。それらのほとんどは合理的です。しかしそれでも、何かを破ったり破ったりしないで、有効なトークンとして扱わないことで間違いを犯しました。カスタマイズされたトークンをsolrに追加してインデックストークンの動作を変更する方法
私は今中国語を書いていると仮定します:big data analysis
は壊れてはならない1つの単語です。それで私の検索でそれを見つけるはずです。また、正確なフレーズAI and big data analysis training
を検索すると、最初のヒットとしてAI and big data analysis training
が見つかるようにしたいと考えています。
ですから、現在のトークンに介入したり補正したりして検索をよりスマートにする方法が必要です。
おそらくファイルにsolr
というファイルがあり、これらのトークンを手作業で特定のフレーズに関連付けることができますか?したがって、インデックス作成のたびに、solrを参照として使用できます。
ですから、トークナイザを使用していますか? 'pf2'と' pf3'引数をedismaxのために使用して、シングルを押し上げることもできます。また、トークンをマージすることを可能にする屋根の要素もありますが、「これらの4つのトークンが1つのトークンでなければなりません」と言うことを許可するものは認識していません。 – MatsLindh