0

複数のカーネルサイズを使用する畳み込みレイヤーからの出力を結合する方法がありますか?例えば、カーネルサイズが(2 * 2)、(3 * 2)、(2 * 3)のカーネルを使用し、次のレイヤーで平均か最大これらすべての値の出力は?CNNで複数のカーネルサイズを組み合わせる

+0

私はあなたの答えはあなたの質問にあると思います。さらに、チャネル次元に沿ってマージすることもできます。これは、SqueezeNetがFire Moduleで行うことです。 –

+0

ありがとう、マティアス..今このコードを見てください。 –

答えて

2
  • 畳み込みフィルタは、すべての特徴マップ上で動作し、古い、よく知られた当初のネットワークで、たとえば、長い時間のために使用されました畳み込みフィルタは単一のフィーチャマップです。
  • パディングを適用したときの出力ディメンションは同じです。次に、畳み込みフィルタのサイズは重要ではありません。その後

は、フィルタは、いくつかの方法で "参加" することができます:出力特徴マップの

  • Concatenation。確かに最も一般的なものです。
  • Summationは、レスポンスで使用されます。
  • Othersのような乗算。しかし、私は彼らがすべてそれを後に連結と別の操作を使用すると言うことができると思います。
+0

リンクと説明的な答えをありがとう。 –

+0

ようこそ。 CNNsへの一般的な紹介をしたいのであれば、[私のマスターズ論文の第2章](https://arxiv.org/pdf/1707.09725.pdf#page=11) –

+0

をお勧めします。連結中のパディングの選択に違いはありますか?例:フィルタサイズが1 * 1,3 * 5 * 5のレイヤーを同じか有効なパディングと組み合わせると、精度に異なる影響がありますか? P.S.私は有効なパディングの出力サイズを管理する必要があります。 –

3

ここでカーネルのサイズは重要ではありませんが、重要なのは各畳み込み演算の出力サイズです。パッディング、ストライドなどを調整して、それぞれのコンボ操作が同じ形状(バッチとチャンネルの次元まで)を出力することを確認したら、チャンネルを連結して集計(合計、平均)するか、より多くのチャンネル。

この種のアプローチは、彼らが入力

  • それぞれの出力として受け取る enter image description here

  • +0

    入手しました。ありがとうございました。 –

    関連する問題