2017-05-25 6 views
0

200件以上のドキュメントをすでにアップロードしているディスカバリコレクションをトレーニングしたい。私はこれらの文書をGUIを通してアップロードしました。ディスカバリーのドキュメントを見ると、トレーニングAPIがまだGUIから公開されていないため、コレクションをトレーニングするためのAPI呼び出しを行う必要があることがわかります。私はこのようになります文書を含める必要があるトレーニングAPI呼び出しの一環として:ディスカバリGUIツールを使用してDocumentIdを検索

{ 
    "natural_language_query": "{natural_language_query}", 
    "filter": "{filter_definition}" 
    "examples": [ 
    { 
     "document_id": "{document_id_1}", 
     "cross_reference": "{cross_reference_1}", 
     "relevance": 0 
    }, 
    { 
     "document_id": "{document_id_2}", 
     "cross_reference": "{cross_reference_2}", 
     "relevance": 0 
    } 
    ] 
} 

私の質問は、私は私はすでにアップロードしたドキュメントに対してdocumentIdsを取得する必要がありますどのようにでしょうか? GUIでこれを見つける方法はありますか?それとも、のようなものを返しますAPI呼び出し:

{ 
    "document_name" = "MyDocument1", 
    "documentId" = "the_document_id_for_MyDocument1" 
}, 

... 

{ 
    "document_name" = "MyDocumentN", 
    "documentId" = "the_document_id_for_MyDocumentN" 
} 

またはdocumentIdsを取得する唯一の方法は次のようになりますが、新しいコレクションを作成し、APIを直接呼び出すを通じてすべてのドキュメントをアップロードし、私としてdocumentIdsを追跡しますそれらを取り戻す? GUIを使用して

答えて

0

、次の手順を実行します。 "グループのクエリ結果(集計)" の

  1. 入力term(_id) テキストボックスを。
  2. extracted_metadata

入力に「指定」を選択し、「フィールドを返す」の下で、そのクエリとフィルタの入力はこのソリューションは、私のために動作しませんでした

+0

空のままにしてください。私は 'term(_id)'と 'term(id)'の両方を試しましたが、両方の集計は結果を返しませんでした。あなたはいくつかの例を投稿できますか? –

関連する問題