連結層は実際にcaffeで4D出力を生成しますか？

私はコンカテインメント層に関する文書をここで読む：Layer Catalogue Concat。それは述べて：連結層は実際にcaffeで4D出力を生成しますか？

入力：

n_i * c_i * h * w for each input blob i from 1 to K.

出力：

軸= 0の場合：(n_1 + n_2 + ... + n_K) * c_1 * h * w、および C_Iすべての入力が同じである必要があります。

if axis = 1：n_1 * (c_1 + c_2 + ... + c_K) * h * w、すべての入力n_iは同じにする必要があります。

しかし、私はすべての層が3D入力を受け入れると、4次元の出力がどのようにできるのか、これを想像していますか？ 4D出力を3D出力として読み込むには何らかのトリックがありますか？

出典

2017-02-08 Kev1n91

実際に入出力はすべて4D：バッチ寸法、チャンネル数、高さ、幅を持っています。特別な場合（例えばRGB-D入力の場合は5D）に異なる数の寸法を得ることができますが、標準RGB画像の場合、4Dはどこにでも保持されます（完全に接続されたレイヤーを除く）。

出典

2017-02-11 23:42:20

caffeのドキュメントは、常に手前のバッチサイズを放棄します。したがって、一般的なバッチサイズには関係しません。 – Kev1n91

私が意味するのは、すべての層のCaffeが通常4Dの入力と出力を処理するということです。操作が3Dブロック上にあっても、バッチサイズ（軸0）に沿って繰り返されます。しかし、「入力が3Dなら4D出力」と言ってどういう意味ですか？私はあなたの意見を誤解している可能性があります。 –

質問は、提示された公式の「何ですか」に分割することができますか？ – Kev1n91

連結層は実際にcaffeで4D出力を生成しますか？

答えて

関連する問題