0

CNNを使って、各ピクセルに3つのラベルが付いた画像を撮りたいと思います。このようなもの:すなわち各ピクセルに複数のラベルがある場合、ピクセル単位で分類することは可能ですか?

0,1 (not object/object) 
0,1,2,3... (Class of object, eg cat,dog) 
0,1,2,3...(Object Number of given class eg, 2nd instance of cat) 

複数猫や犬の画像をCNNが与えだろう所与のピクセルがオブジェクトからのものである、そのオブジェクトが猫であり、それは猫の第2のインスタンスに属すること出力画像(左上隅から数えて)。

これは単一のCNNで可能ですか、この結果を得るには複数のCNNを組み合わせる必要がありますか?

EDIT:最初に、各ピクセルがすでに2つまたは3つのラベルを持つ注釈付き画像でCNNをトレーニングする必要があることを理解しておく必要があります。

答えて

0

完全畳み込みニューラルネットワークを調べる必要があります。基本的に、これらは完全接続層のないCNNであり、代わりにデコンボリューション層を含みます。したがって、N×Nサイズの画像が与えられると、N×Nサイズの画像が出力され、各ピクセルはそれ自体のラベルを有し、セマンティックセグメンテーションに直接適用される。

関連する問題