2

AlexNetの画像データは3*224*224です。AlexNetのニューロンの数

第1の畳み込み層は、4つのピペセルのストライドを有するサイズ11*11*3の96のカーネルで画像をフィルタリングする。

私は最初の層の出力ニューロン数に疑念があります。私の意見で

、入力が224*224*3=150528で、出力は​​

でなければなりません。しかし、紙では、彼らは出力を説明し、私はこの数を計算する方法がわからない253440

です層のニューロン。

誰かが私を助けることができますか?ありがとうございました!

+1

私の意見では、あなたはかなり明確に間違いがあることを発見しました。最初の層の出力は290400になるはずです。 – Aenimated1

+0

私は彼らが何をしたのか分かります。 48 * 55 * 96 = 253440。それはちょうどねじです。 – Aenimated1

+0

@ Aenimated1私はなぜ「48 * 55」なのか分からない。私はフィルタリングされた画像のサイズが「55 * 55」だと思う。 – zdczdcc

答えて

0

私もこれは作者のミスであると信じて、私は、the courseware of stanford cs231nに証拠を発見した10日と11日のページには、まずCONVの出力サイズは、それはのように思える290400.

1

であることを見つけることができます入力サイズはパディングなしで227x227です。私はまた、彼らが論文で言及しているのは間違いだと思います。このリンクを見てください。

http://cs231n.github.io/convolutional-networks/

それは、以下の情報を記載しています。

The Krizhevsky et al。 2012年のImage [227x227x3]のイメージを受け入れたImageNetチャレンジを獲得したアーキテクチャ最初の畳み込み層では、受容野サイズF = 11、ストライドS = 4、ゼロパディングP = 0のニューロンを使用した。 Conv層の深さはK = 96であるため、(227-11)/ 4 + 1 = 55であるため、Conv層の出力ボリュームのサイズは[55x55x96]でした。このボリュームの55 * 55 * 96ニューロンのそれぞれは、入力ボリュームのサイズ[11x11x3]の領域に接続されていました。さらに、各深度列のすべての96個のニューロンは、入力の同じ[11×11×3]領域に接続されますが、もちろん異なる重みを使用します。あなたが実際の論文を読むと面白いことに、入力画像が224x224であると主張しています。なぜなら(224 - 11)/ 4 + 1は非常にはっきりと整数ではないからです。これはConvNetsの歴史において多くの人々を混乱させており、何が起こったかについてはほとんど知られていません。私自身が推測することは、アレックスは3つの余分なピクセルのゼロパディングを使用していたことです。

+0

はい、間違いました.Google-Netの入力サイズは224x224、alex-netは227x227です。 – zdczdcc

関連する問題