2017-02-08 8 views
0

私はコンカテインメント層に関する文書をここで読む:Layer Catalogue Concat。それは述べて:連結層は実際にcaffeで4D出力を生成しますか?

入力:

n_i * c_i * h * w for each input blob i from 1 to K.

出力:

軸= 0の場合:(n_1 + n_2 + ... + n_K) * c_1 * h * w、および C_Iすべての入力が同じである必要があります。

if axis = 1:n_1 * (c_1 + c_2 + ... + c_K) * h * w、すべての入力n_iは同じにする必要があります。

しかし、私はすべての層が3D入力を受け入れると、4次元の出力がどのようにできるのか、これを想像していますか? 4D出力を3D出力として読み込むには何らかのトリックがありますか?

答えて

1

実際に入出力はすべて4D:バッチ寸法、チャンネル数、高さ、幅を持っています。特別な場合(例えばRGB-D入力の場合は5D)に異なる数の寸法を得ることができますが、標準RGB画像の場合、4Dはどこにでも保持されます(完全に接続されたレイヤーを除く)。

+0

caffeのドキュメントは、常に手前のバッチサイズを放棄します。したがって、一般的なバッチサイズには関係しません。 – Kev1n91

+0

私が意味するのは、すべての層のCaffeが通常4Dの入力と出力を処理するということです。操作が3Dブロック上にあっても、バッチサイズ(軸0)に沿って繰り返されます。しかし、「入力が3Dなら4D出力」と言ってどういう意味ですか?私はあなたの意見を誤解している可能性があります。 –

+0

質問は、提示された公式の「何ですか」に分割することができますか? – Kev1n91

関連する問題