私はしばらくの間、Elasticsearchを使用しているが、私は、この特定の問題を解決アナライザを見つけるように見えることはできません。 私は次のテキストを含む文書を持っている: "The Harry Potter and the Sorcerer Stone is a great book".
ユーザーが「ハリー・ポッターシリーズ」場合(スペースなし)、その文書を検索結果として表示できる必
私はbigramsとunigramsを扱っています。 私のバイグラムはタプルのカウンタであり、私のユニグラムは私がfollwing for b,countB in bigrams.most_common()
key=b[0] # this is guaranteed to be a key for my unigrams
uniCount=uni[key]
を実行しよう