私はSolr5.2.1と協力し、2つの異なる値のインデックス私の変数(リンク)(元のリンク、コアリンク)例えばSolrのインデックスWebリンク
にしたいんだ、その後、入力http://wiki.apache.org/solr/がある場合には、元のリンクはhttp://wiki.apache.org/solr/そのものであり、コアリンクはwiki.apache.org
私の現在のSolrは、元のリンクのためのコアリンクをindexsが、ではありません。 私のsolrの設定に助けてください元のリンクをインデックス化するとうまくいきます
私のschema.xmlに、リンクは以下のように定義され、 "text_general"が使用されています。
<field name="link" type="text_general" indexed="true" stored="true" required="false" />
<fieldType name="text_general" class="solr.TextField" positionIncrementGap="100" multiValued="true">
<analyzer type="index">
<tokenizer class="solr.StandardTokenizerFactory"/>
<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
元のリンクを取得するには、multiValued = "true"を使用する必要がありますか?
あなたが述べたように、私はキーワードのトークナイザに標準トークナイザファクトリーを変更しました。その後、元のリンクのみを提供します。元のリンクとコアリンクの両方をどのようにインデックスできますか? –
また、コアリンクのインデックスを作成する場合は、schema.xmlに別のフィールド 'url_core'を作成し、fieldTypeを' text_url_core'として作成し、正規表現トークナイザを次のように定義します。 ' <トークナイザクラス=" Solrの。 PatternTokenizerFactory "pattern ="(http [s]?| ftp):\/\ /(\ * \)\/"group =" 2 "/> ' –
hp36