2011-02-11 12 views
0

これは私の元の投稿の編集です:私は私の問題をはっきりと表現したとは思わない。schema.xml設定?

私たちはサプライヤーからハードウェア製造データをXMLファイルで受け取ります。典型的な日には、25,000のファイルがあります。それが私がSolrを実装することを選んだ理由です。

ファイル名がそのように

CTCA~PRE~PREP~1010123~ONTDTVP5A~41~P~R16-500~000912239878~20110125~212321.XML 

当社のR「& Dの連中は、ファイルのXMLファイル名(OR演算)の各分野できる検索ようにしたいが、彼らはドンのようなtildasで区切られた11枚の分野で作られていますファイルの内容を検索してください。理想的には、 "stbmodel"が "R16-500"または "result"が "P"または "filedate"であるすべてのファイルに対して "20110125"というクエリを実行したいと考えています。

私は(左から右へ - 長いリストのため申し訳ありません)のようなので、schema.xmlを各データフィールドに定義された:

field name="location"  type="textgen"   indexed="false" stored="true" multiValued="false"/ 
    field name="scriptid"  type="textgen"   indexed="false" stored="true" multiValued="false"/ 
    field name="slotid"   type="textgen"   indexed="false" stored="true" multiValued="false"/ 
    field name="workcenter"  type="textgen"   indexed="false" stored="false" multiValued="false"/ 
    field name="workcenterid" type="textgen"   indexed="false" stored="fase" multiValued="false"/ 
    field name="result"   type="string"   indexed="true" stored="true" multiValued="false"/ 
    field name="computerid"  type="textgen"   indexed="false" stored="true" multiValued="false"/ 
    field name="stbmodel"  type="textgen"   indexed="true" stored="true" multiValued="false"/ 
    field name="receiver"  type="string"   indexed="true" stored="true" multiValued="false"/ 
    field name="filedate"  type="textgen"   indexed="false" stored="true" multiValued="false"/ 
    field name="filetime"  type="textgen"   indexed="false" stored="true" multiValued="false"/ 

はまた、私は一意のキーフィールド「受信機」と定義。しかし、私の質問では結果は返されません。私はこのように私のインデックスを更新しました:

"java -jar apache-solr-1.4.1/example/exampledocs/post.jar *XML". 

私は明らかに何かが欠落しています。何か案は?。

A1。

PS:私の次のステップは、 "solr.KeywordTokenizerFactory"を試すことです。

答えて

0

別のフィールドとして追加しないでください。したがって、データを挿入する場合は、検索する関連フィールドをレコードとともに挿入します。したがって、ファイル名を検索する際には考えないでください。ファイル名は、ファイル内容のピアである単なるデータフィールドと考えることができます。

関連する問題