2016-10-20 4 views
0

Retrieve and Rankサービスで多数のPDF文書をロードしていますが、SolrやIBM Retrieve and Rankサービスに、PDF文書の特定の部分を後で照会するフィールドと見なす必要があるとは知らない、名前、または文書のプロセスIDです。IBM Watson - Retrieve and Rank:PDF文書内のテキストをフィールドと見なす方法を教えてください。

+0

スタックオーバーフローへようこそ!良い質問をするので、良い答えを得るためにあなたを助けるために私たちの[SO質問チェックリスト](http://meta.stackoverflow.com/questions/260648/stack-overflow-question-checklist)を確認してください。 –

答えて

0

WebベースのUIを使用してドキュメントをアップロードするときは、本文やタイトルなどの既定のフィールドのみが設定されます。

ただし、PDF文書の内容をR & Rコレクションにプログラムで追加することはできます。これを行うと、自由に任意のフィールドを追加できます。

など。この例では、authorbibliographyなどの追加のフィールド名を使用しているのと同様にhttps://www.ibm.com/watson/developercloud/retrieve-and-rank/api/v1/?java#index_doc

RetrieveAndRank service = new RetrieveAndRank(); 
service.setUsernameAndPassword("{username}","{password}"); 

SolrInputDocument newdoc = new SolrInputDocument(); 
document.addField("id", 1); 
document.addField("author", "brenckman,m."); 
document.addField("bibliography", "j. ae. scs. 25, 1958, 324."); 
etc... 

UpdateResponse addResponse = solrClient.add("example_collection", newdoc); 

solrClient.commit("example_collection"); 

のドキュメントから、あなたは、このようなプロセスIDとして新しいものを追加することができます。

これらの新しいフィールドを指定するには、R & Rコレクションのスキーマを更新する必要があります。追加のフィールドを指定する方法の例として、スキーマhttps://github.com/IBM-Watson/kale/blob/master/solr/knowledge-expansion-en.xml#L36を使用することができます。

+0

ありがとう!私の命を救いました。 –

関連する問題