これは私の元の投稿の編集です:私は私の問題をはっきりと表現したとは思わない。schema.xml設定?
私たちはサプライヤーからハードウェア製造データをXMLファイルで受け取ります。典型的な日には、25,000のファイルがあります。それが私がSolrを実装することを選んだ理由です。
ファイル名がそのように
CTCA~PRE~PREP~1010123~ONTDTVP5A~41~P~R16-500~000912239878~20110125~212321.XML
当社のR「& Dの連中は、ファイルのXMLファイル名(OR演算)の各分野できる検索ようにしたいが、彼らはドンのようなtildasで区切られた11枚の分野で作られていますファイルの内容を検索してください。理想的には、 "stbmodel"が "R16-500"または "result"が "P"または "filedate"であるすべてのファイルに対して "20110125"というクエリを実行したいと考えています。
私は(左から右へ - 長いリストのため申し訳ありません)のようなので、schema.xmlを各データフィールドに定義された:
field name="location" type="textgen" indexed="false" stored="true" multiValued="false"/
field name="scriptid" type="textgen" indexed="false" stored="true" multiValued="false"/
field name="slotid" type="textgen" indexed="false" stored="true" multiValued="false"/
field name="workcenter" type="textgen" indexed="false" stored="false" multiValued="false"/
field name="workcenterid" type="textgen" indexed="false" stored="fase" multiValued="false"/
field name="result" type="string" indexed="true" stored="true" multiValued="false"/
field name="computerid" type="textgen" indexed="false" stored="true" multiValued="false"/
field name="stbmodel" type="textgen" indexed="true" stored="true" multiValued="false"/
field name="receiver" type="string" indexed="true" stored="true" multiValued="false"/
field name="filedate" type="textgen" indexed="false" stored="true" multiValued="false"/
field name="filetime" type="textgen" indexed="false" stored="true" multiValued="false"/
はまた、私は一意のキーフィールド「受信機」と定義。しかし、私の質問では結果は返されません。私はこのように私のインデックスを更新しました:
"java -jar apache-solr-1.4.1/example/exampledocs/post.jar *XML".
私は明らかに何かが欠落しています。何か案は?。
A1。
PS:私の次のステップは、 "solr.KeywordTokenizerFactory"を試すことです。