次へthis質問とこのtutorialチュートリアルと同じように単純なネットを作成しましたが、100X100の画像と11X11とpad = 0の最初の畳み込みカーネルがあります。caffe convnetの3番目の要素を計算するには?
式Iであることを理解する:(W-F + 2P)/ S + 1と私の場合寸法は、(3 RGBのチャネルである)51X51X3]となったが、私のネット図中番号96ポップアップとこのtutorialは出力の3次元であると言いましたが、最初のconv後のネットは[51X51X96]になりました。私は数字96の計算方法と理由を理解できませんでした。
ネットワーク畳み込みレイヤーが3つのカラーチャネルをスローし、出力が3つのフィーチャマップである必要がありますか?どのように次元がこれのように成長するのですか?チャンネルごとに1つのカーネルがあるのは本当ですか?このカーネルがどのようにして96(または最初のチュートリアル、256または384)のフィーチャーマップを作成するのですか?