私は、文字列アナライザの仕組みや、インデックスの用語配列を構築するときにどの文字を解析するのかに関するドキュメントを探していますか?デフォルトのアナライザはどの文字を解析しますか?
は一例です:
私はインデックスにした場合は、フィールドを持っていた文書が"test"
または"hotmail.com"
がクエリとして与えられたならば、試合のクエリはこの文書を返す値"[email protected]"
でemail
と呼ばれます。これは、アナライザーが@
文字で解析しますが、.
文字では解析しないことを示しています。
他の文字が通常の文字として扱われ、どの文字が完全に取り除かれ、どの文字が解析されるかについてもっと知りたいですか?
私はこの情報をどこに見つけることができますか? 2番目のリンクで説明したように