2017-04-16 16 views
2

TensorflowチュートリアルとAPIのドキュメントを読んで、どのように畳み込み入力とフィルタ引数の形を定義したのか分かりません。方法はtf.nn.conv2d(input, filter, strides, padding, use_cudnn_on_gpu=None, data_format=None, name=None)で、入力は形状:[batch, in_height, in_width, in_channels]で、フィルタは形状:[filter_height, filter_width, in_channels, out_channels]です。誰かが "in_channel"と "out_channel"のサイズを適切に定義する方法を明らかにすることができれば、非常に役に立ちます。Tensorflow tf.nn.conv2d clarification

答えて

1

in_channelsは、構成レイヤーへの入力の深さを指します。たとえば、生のRGB画像をレイヤーに送る場合、レッド、グリーン、ブルーの各チャンネルに対応する深度は3になります。つまり、カーネルは実際には2Dではなく3Dです。 out_channelsは、出力の深さを示します。

enter image description here

properly define実験に基づいて行われるものです:hereから絵に続いて、5の3の入力深さと出力の深さを持つ例を示しています。それはネットワーク設計上の問題です。 AlexNetVGG-16のような有名なアーキテクチャについては、実際にネットワークアーキテクチャがどのように設計されているかをご覧ください。

+0

ありがとうございました! – ColeS

+0

@コールズ、問題ありません。 StackOverflowで誰かに感謝するには、あなたが質問の著者である場合は受け入れられたものとしてマークするか、答えに親指を付けることができます(回答に答えたい場合) – Ali