Concept Insightsの概念検索では、ドキュメント内の同じ(または関連する)概念のいくつかの言及を無視しません。実際、このサービスはこの情報を使用して、各文書でカバーされている概念領域の理解を強化しています。
しかし、文書が文書に関連する理由の「説明」では、/conceptual_search
エンドポイントは選択された一連の概念を返すことは事実です。システムは、クエリとドキュメントとの間の接続を正当化する概念の多様性を示すため、「説明」の一部として繰り返される概念を省略することができます(この「説明」については、従来の検索エンジンは、なぜ文書が関連性があるのかをユーザに示唆することがあり、それはではなく、である。
文書内で抽出されたすべての概念を、/ annotationsエンドポイント:GET /v2/corpora/{account_id}/{corpus}/documents/{document}/annotations
を使用して取得します。
(ドキュメント:https://watson-api-explorer.mybluemix.net/apis/concept-insights-v2#!/corpora/getDocumentAnnotations)
文書内のすべての注釈のために、あなたは、文書の発生のためのテキストの位置と一緒に概念IDを取得します。したがって、上の例では、次のことができます。
1)/conceptual_search
エンドポイントを呼び出して、クエリに関連するドキュメントと、多数の説明コンセプト(ドキュメントをクエリに結びつける概念)を取得します。そのコンセプトが質問であることがわかったと言うとGold
です。
2)返されたドキュメントに対して/{document}/annotations
を呼び出し、選択されたドキュメント内の「説明コンセプト」(Gold
)の追加の出現を探します。文書全体をカバーするGold
の出現のリスト(他の説明概念のリストと共に)を構築することができるはずです。