私は、カスタムデータセットよりも速いRCNNをトレーニングしましたが、異常な結果がありました。トレーニングの反復回数が増え、ボットの検証とトレーニングデータのためにネットワークのパフォーマンスが低下します。損失は減少していますが、これは驚くべきことです。目的は葉を検出することです。以下は高速/高速RCNの座標系
は、ここで注意すべき事は165000回の反復の後で、ネットワークはあまりにも背景にボックスを描画するために開始し、それぞれ200および165000の反復の画像
です。
これは、トレーニングデータのアノテーションに何らかの不具合があり、トレーニングで損失が減っているためだと思います。
私が作った注釈ファイルには、画像の左上にある(0,0)というmatlabに似た座標系があります。したがって、各境界ボックスの左上隅は(x_min、y_min)、右下は( x_max、y_max)。それがそうであるかどうか、これがそうであれば、他に何が問題になるのでしょうか?