私は次のコードがありますから取ら高速R-CNNとBrainScript
model (features, rois) = {
convOut = convLayers (features)
roiOut = ROIPooling (convOut, rois, (9:9),spatialScale=64.0/196.0)
z = fcLayers (roiOut)
}.z
オリジナル:検出\ FastRCNN \ BrainScript \ cntk \例を\画像
ROIPoolingでspatialScaleは何ですかどのように計算するのですか?
これがcntk.exeの出力で見つかった場合は、
検証中 - > z.convOut.z.rn3.rr = RectifiedLinear(z.convOut.z.rn3.rr_):[49 x 49 x 64 x *] - > [49 x 49 x 64 x *]
検証 - >のROI = inputValueで(): - > 4×1000×*]
検証 - > z.roiOut = ROIPooling(z.convOut.z.rn3.rr、関心領域):[49×49×64×]、[4×1000×*] - > [9×9×64×1000×*]
だから私の例では、私は、64×64のROIと196x196の入力画像が備わっていています。これにより、spatialScale = 64/196 = 0,32 –
ROIノードの入力解像度はどのようになりますか?ROIサイズは決まります。 –
あなたが正しく理解していれば、あなたはroiOutへの入力解像度を求めています。私は、質問に対する解決策であると思うものを加えました。 –