セマンティックセグメンテーションペーパーを読むとき、いつか、マスク画像のワンホットラベルのような用語を読むことができます。私はそれが本当に何を意味するのか明確ではないのですか?いくつかの実装を読むとき、私はそれらが通常形であることを見ることができますrows*columns*2
セマンティックセグメンテーションのためのワンホットラベル
私の推測では、1つのチャネルはフォアグラウンドに対応し、もう1つはバックグラウンドに対応しています。そうですか?さらに、どのようにフォアグラウンドを知ることができますか?既存のトレーニングセットの形状がrows*columns*1
の場合のみです。このタイプのフォーマット、つまりrows*columns*2
に転送するにはどうすればよいですか?私がやっているのは、newimage[:,:,:,0] = original_image
とnewimage[:,:,:,1] = 1-original_image
です。しかし、私はそれが正しいかどうか分からないのですか?
このu-netペーパーのように、https://arxiv.org/pdf/1505.04597.pdfのように、2つの出力チャンネルを使用し、softmaxの起動とログの消失 – user785099
ページ4の下部フォアグラウンド/バックグラウンドマスクと各クラスのカテゴリーラベルを使用してください(5ページの上部に記載されています)。 – Steven