2016-05-02 15 views
2

私はチュートリアルDeep MNIST for Expertsを読んでいます。 Densely Connected Layerセクションの始めに、「[...]画像サイズが7x7に縮小されました」と記載されています。TensorFlowでイメージを7x7に縮小する方法は?

私はこれらの7x7マトリックスにどのようになっているのか分かりません。私の理解では、28x28で始まり、5x5コンボリューションカーネルの2つのレイヤーを持っています。 28を4で割った値は7ですが、5で除算されません。

答えて

3

5x5は畳み込み層の「ウィンドウ」サイズです。画像のサイズは縮小されません。TensorFlowとCaffeは、自動的に境界パッドを供給します。トーチは名前を付けるために、その境界線を追加する必要があります(この場合、各方向に2つの場所があります)。

各カーネル(フィルタ)は、画像全体の5x5サブセットを考慮します。例えば、画像内の位置[7,12]の値を計算するために、畳み込みプロセスは「ウィンドウ」[5:9,10:14]を考慮する。これらの25の各値に対応する重みを乗算し、それらの積を合計します。この合計は、中央正方形[7,12]の次の層の値になります。

このプロセスは、イメージ内のすべての位置、およびレイヤー内の各カーネルについて繰り返されます。

@Aenimated1はすでに述べたように、サイズの削減は、それぞれ2倍の2つのプールから行われます。この操作では、画像を2x2のウィンドウに分割し、各2x2の正方形の最大値(またはユーザーが指定する場合は他の表示)を渡します。これにより、28x28画像が14x14に縮小されます。 2番目のプーリングによって7x7に減少します。

1

"イメージサイズ"の減少は、各畳み込みレイヤの後に追加されたプールレイヤの結果です。各2x2プールは、幅と高さを2倍に減少させ、したがって両方のプール操作の後に7x7マトリックスを生成する。