IBM Watson - Retrieve and Rank：PDF文書内のテキストをフィールドと見なす方法を教えてください。

Retrieve and Rankサービスで多数のPDF文書をロードしていますが、SolrやIBM Retrieve and Rankサービスに、PDF文書の特定の部分を後で照会するフィールドと見なす必要があるとは知らない、名前、または文書のプロセスIDです。IBM Watson - Retrieve and Rank：PDF文書内のテキストをフィールドと見なす方法を教えてください。

出典

2016-10-20 Wagner Santana

スタックオーバーフローへようこそ！良い質問をするので、良い答えを得るためにあなたを助けるために私たちの[SO質問チェックリスト]（http://meta.stackoverflow.com/questions/260648/stack-overflow-question-checklist）を確認してください。 –

WebベースのUIを使用してドキュメントをアップロードするときは、本文やタイトルなどの既定のフィールドのみが設定されます。

ただし、PDF文書の内容をR & Rコレクションにプログラムで追加することはできます。これを行うと、自由に任意のフィールドを追加できます。

など。この例では、authorとbibliographyなどの追加のフィールド名を使用しているのと同様にhttps://www.ibm.com/watson/developercloud/retrieve-and-rank/api/v1/?java#index_doc

RetrieveAndRank service = new RetrieveAndRank(); 
service.setUsernameAndPassword("{username}","{password}"); 

SolrInputDocument newdoc = new SolrInputDocument(); 
document.addField("id", 1); 
document.addField("author", "brenckman,m."); 
document.addField("bibliography", "j. ae. scs. 25, 1958, 324."); 
etc... 

UpdateResponse addResponse = solrClient.add("example_collection", newdoc); 

solrClient.commit("example_collection");

のドキュメントから、あなたは、このようなプロセスIDとして新しいものを追加することができます。

これらの新しいフィールドを指定するには、R & Rコレクションのスキーマを更新する必要があります。追加のフィールドを指定する方法の例として、スキーマhttps://github.com/IBM-Watson/kale/blob/master/solr/knowledge-expansion-en.xml#L36を使用することができます。

出典

2016-10-21 10:43:56 dalelane

ありがとう！私の命を救いました。 –

IBM Watson - Retrieve and Rank：PDF文書内のテキストをフィールドと見なす方法を教えてください。

答えて

関連する問題