実際には、マルチラベルの分類を探しています。複数ラベルの分類は、ラベルごとにただ1つの1ホットベクトルで実行できます。しかし、今や1つのホットベクトルは、単一のホットベクトルではなく、各サンプルについて複数のベクトルを有する。
ここでは、イメージ注釈タスクのマルチラベル分類に関する参考資料はほとんどありません。これらは便利なことがあります:
- Makadia、A.、Pavlovic、V.、Kumar、S .:イメージ注釈の新しいベースライン。 In:ECCV。 (2008)
- Guillaumin、M.、Mensink、T.、Verbeek、J.、Schmid、C .: Tagprop:画像自動注釈のための最近隣モデルにおける識別メトリック学習。 In:ICCV。 (2009)
- Verma、Y.、Jawahar、C.V .:意味論的近傍におけるメトリック学習を用いた画像注釈。 In:ECCV。 (2012)
- Weinberger、K.Q.、Blitzer、J.、Saul、L.K .:大きなマージンの最も近い近隣分類のための距離メトリック学習。 In:NIPS。 TagPropと2PKNNのために(2006)
、コードは次の場所にあります。
- TagProp:lear.inrialpes.fr/people/guillaumin/code/TagProp_0.2.tar.gz
- 2PKNN :researchweb.iiit.ac.in/~yashaswi.verma/eccv12/2pknn.zip
通常、行列をMxN次元の単一ベクトルに平坦化できます。異なる最適化ターゲットを考慮に入れて損失関数を変更する必要があるかもしれないことに留意してください。 –
@ThomasJungblutは答えてくれてありがとう、これに対応できる損失関数の例を教えてくれますか? –