2017-06-16 19 views
1

「セマンティックセグメンテーションのための完全畳み込みネットワーク」 の著者は、デコンボリューションのコンテキストで入力ストライドと出力ストライドを区別しています。 これらの用語はどう違うのですか?CNN:入力ストライド対出力ストライド

答えて

1

入力ストライドがフィルタのストライドです。どのくらい出力でフィルターをシフトしますか。

出力ストライドこれは実際には公称値です。いくつかの畳み込み、最大プール操作を行った後、CNNでフィーチャマップを取得します。入力画像が224 * 224で、最後のフィーチャマップが7 * 7であるとします。

はその後、我々は我々の出力ストライドがあると言う:7分の224 = 32(ダウンサンプリング後の画像に何が起こったのかの目安。)

scriptこの出力ストライドで、そしてどのようにFCNで使用するかを説明このtensorflow密集予測の場合である。

の空間次元が32 + 1の倍数である入力、たとえば[321,321]を使用します。 の場合、ResNet出力のフィーチャマップは、 [(height-1)/ output_stride + 1、(width-1)/ output_stride + 1] のコーナーとスペースが正確に入力画像のコーナーに揃えられます。 は、フィーチャのイメージへのアライメントを容易にします。入力として[225、225] イメージを使用すると、最後のResNetブロックの出力で[8,8]フィーチャマップになります。

関連する問題