2016-05-01 14 views
0

を仕事とSolrの6.0.0で文書を抽出し、私はそれが次のクエリ使用して索引付けされていることが分かりません。Solr検索は、私がアップロードした

http://localhost:8983/solr/techproducts/select?indent=on&q=id:doc1&wt=json

{ 
    "responseHeader":{ 
    "status":0, 
    "QTime":1, 
    "params":{ 
     "q":"id:doc1", 
     "indent":"on", 
     "wt":"json"}}, 
    "response":{"numFound":1,"start":0,"docs":[ 
     { 
     "links":["http://www.education.gov.yk.ca/"], 
     "id":"doc1", 
     "last_modified":"2008-06-04T22:47:36Z", 
     "title":[" PDF Test Page"], 
     "content_type":["application/pdf"], 
     "author":"Yukon Canada Yukon Department of Education", 
     "author_s":"Yukon Canada Yukon Department of Education", 
     "content":[" \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n PDF Test Page \n \n \n \n \nPDF Test File \n \nCongratulations, your computer is equipped with a PDF (Portable Document Format) \nreader! You should be able to view any of the PDF documents and forms available on \nour site. PDF forms are indicated by these icons: or . \n \nYukon Department of Education \nBox 2703 \nWhitehorse,Yukon \nCanada \nY1A 2C6 \n \nPlease visit our website at: http://www.education.gov.yk.ca/\n \n \n \n \n "], 
     "_version_":1533049305513852928}] 
    }} 

Iをフィールド内容に単語PDFの出現回数があることを確認してください。

なぜたとえばtitleのために、異なるフィールドを使用してクエリを実行すると、その後、私が持っているフィールド名contentがあるとき、私は、次のクエリで何も結果を取得していないのです、それはPDF内部?:

select?q=*:*&fq=content:PDF 

{ 
    "responseHeader":{ 
    "status":0, 
    "QTime":4, 
    "params":{ 
     "q":"*:*", 
     "indent":"on", 
     "fq":"content:PDF", 
     "rows":"50", 
     "wt":"json"}}, 
    "response":{"numFound":0,"start":0,"docs":[] 
    }} 

が含まれています右の結果:

select?q=*:*&fq=title:PDF 

{ 
    "responseHeader":{ 
    "status":0, 
    "QTime":3, 
    "params":{ 
     "q":"*:*", 
     "indent":"on", 
     "fq":"title:PDF", 
     "rows":"50", 
     "wt":"json"}}, 
    "response":{"numFound":1,"start":0,"docs":[ 
     { 
     "links":["http://www.education.gov.yk.ca/"], 
     "id":"doc1", 
     "last_modified":"2008-06-04T22:47:36Z", 
     "title":[" PDF Test Page"], 
     "content_type":["application/pdf"], 
     "author":"Yukon Canada Yukon Department of Education", 
     "author_s":"Yukon Canada Yukon Department of Education", 
     "content":[" \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n PDF Test Page \n \n \n \n \nPDF Test File \n \nCongratulations, your computer is equipped with a PDF (Portable Document Format) \nreader! You should be able to view any of the PDF documents and forms available on \nour site. PDF forms are indicated by these icons: or . \n \nYukon Department of Education \nBox 2703 \nWhitehorse,Yukon \nCanada \nY1A 2C6 \n \nPlease visit our website at: http://www.education.gov.yk.ca/\n \n \n \n \n "], 
     "_version_":1533049305513852928}] 
    }} 
+0

あなたがのschema.xmlを共有してくださいます検索を実現し、フィールドの元の値を取得するのに役立ちます... –

答えて

0

コンテンツfieldのために定義されfield typeのためのあなたのschema.xmlを確認してください。

コンテンツタイプとタイトルフィールドのフィールドタイプを比較します。

フィールドの内容に適切なフィールドタイプが定義されていない場合があります。これらのフィールドタイプは、テキスト用のトークンを生成していないか、またはテキスト全体を考慮している必要があります。これは、フィールドにkeywordtokenizerまたはstringフィールドタイプを使用している場合に発生します。

デバッガーツールSolrと同じものをチェックしたり、解析したりすることができます。

ここでは、テキストの索引付け方法とテキストの検索方法を確認できます。

fieldを検索する場合は、属性indexed=trueを指定する必要があります。また、solrが同じ値を返すようにするには、stored=trueを追加する必要があります。

これら2 attributeはあなたが

+0

私が持っている次の管理・スキーマ内の<フィールド名= "コンテンツ"true" multiValued = "true" />およびだから、私はコンテンツフィールドのインデックス属性をtrueに変更し、sorlサーバーを再起動する必要がありますか? – user1563721

+0

私はそれを真に変更し、変更はありません...私はまだ 'content'フィールドを検索することができません。 – user1563721

+0

変更後..サーバを再起動してデータを再インデックスする必要があります。 –

関連する問題