私は畳み込みニューラルネットワークを訓練して、画像を5つのクラス(クラス1〜クラス5)の1つに分類します。畳み込みニューラルネットワークが歪んだ予測を作成
私はクラス1のトレーニング画像が非常に少ないので、ランダムな作物を取り、画像を反転させてより多くのデータを作成することで、データの増強を行った。私はクラス2 - 5のために少なくとも3000の訓練画像を持っています。今、私の訓練セットはクラスごとに3000の画像で構成され、私は確率的勾配降下を使用してそれを訓練します。
私のテストセットはで構成されています
Class 1 - 8 images
Class 2 - 83 images
Class 3 - 227 images
Class 4 - 401 images
Class 5 - 123 images
マイネットワークが正しく予測:
Class 1 - 0 images
Class 2 - 0 images
Class 3 - 0 images
Class 4 - 399 images
Class 5 - 0 images
を、私は非常に正確なネットワークは私のトレーニングセットの制限と15000枚の画像がおそらくある与えられた期待していませんそれだけでは十分ではありませんが、クラス2 - 5には同じ数の別個のトレーニング画像があったので、それほど歪んでいないと思います。私がクラス4の画像のかなり大きな部分でネットワークを訓練していたなら、これは私を驚かせることはありません。私はネットワークが他のクラスの少なくともいくつかを正しく予測すると思っていたでしょう。
どのような考えですか?
EDIT:画像の
タイプ:建物
ネットワークアーキテクチャ:
Input image - 256 x 256 x 3
Convolutional layer - 15 x 15 filters, 16 filters
Max 2x2 pooling layer
Convolutional layer - 11 x 11 filters, 32 filters
Max 2x2 pooling layer
Convolutional layer - 7 x 7 filters, 64 filters
Max 2x2 pooling layer
Fully connected layer - 1024 outputs
Softmax classifier layer - 5 outputs
コスト機能:クロスエントロピー
特定のデータサイエンススタック交換があります - 多分あなたの質問がある方が良いでしょうか? – user3791372
convnetのアーキテクチャと、分類しているオブジェクトについて説明する必要があります。 –
@ user3791372その方向で私を指摘してくれてありがとう! – jlhw