コンピュータビジョンAPIには、画像のタグを取得するための少なくとも2つの方法があります。ビジョンAPI:異なるタグリスト
the documentationによれば、「説明」のタグのリストとトップレベルの「タグ」リストがあります。 「タグ」リストにはさらに信頼度が含まれていますが、「説明タグ」リストには含まれていません。
しかし、説明タグリストはトップレベルのタグリストよりも徹底しているように見えます。通常、タグの数は5〜10倍です。
なぜ2つの異なるタグリストがあり、それぞれのリストのユースケースは何ですか? また、description-tagsリストに最上位タグのリストよりも多くのタグが表示される理由はありますか?すなわち、説明が主なタグリストのタグのサブセットに基づいており、私は反対のことを期待しているはずだ直観によって
、
"description": {
"tags": [
"person",
"man",
"outdoor",
"window",
"glasses",
[...]
],
---------
"tags": [
{
"name": "person",
"confidence": 0.98979085683822632
},
{
"name": "man",
"confidence": 0.94493889808654785
}