私は検索したいURLのデータベースを持っています。 URLは常に同じ(wwwがある場合とない場合があります)と書かれているわけではないので、私はURLを索引付けして照会する正しい方法を探しています。私はいくつかのことを試してみた、と私はそれが動作しない理由を私は近いがわからないと思う :たとえばSolrでのURLのインデックス作成とクエリ
<fieldType name="customUrlType" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
<filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="0" catenateNumbers="0" catenateAll="0" splitOnCaseChange="0" preserveOriginal="1"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
<filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="0" catenateNumbers="0" catenateAll="0" splitOnCaseChange="0" preserveOriginal="0"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
</fieldType>
:
ここでは私のカスタムフィールドタイプです
http://www.twitter.com/AndersonCooperインデックス化する場合、異なる位置に次の単語を持っています:HTTP、WWW、さえずり、COM、アンダーソン・クーパー
私は単にtwitter.com/andersoncooperを検索する場合、私はインデックスされたレコードを一致させるために、このクエリをしたいと思いますが、 というわけで私もWDFを使って検索クエリ を検索しますが、検索クエリは次のようになります。
myfield :("twitter com andersoncooper")次のすべての言葉:twitter com andersoncooper
私は使用するはずの別のクエリフィルタまたはトークナイザはありますか?
これを並べ替えることはできませんでしたか? – Cyrus
ここで何をする必要があるのかわかりましたか? –