答えて

1

私には分かりません。根本的な問題は、フィルタ形状を標準化することができることです。我々は、事実上の単純な四角形を標準として選んだ。実際には、より高度なネットは任意の入力を受け取りますが、各イメージから四角いクロッピングを取り入れることでそれに適応します。

あなたが気になっている場合は、さまざまなCNNレイヤールーチンを固定して、固定された正方形のサイズではなく、任意の長方形で動作するようにしてください。経験は、原作の一部のクロッピングされたイメージを取り上げることも強く示唆していますが、「経験」を何回も上回ったかを見てください。

+0

私はすでに人物の切り抜き画像を撮っています。私は実際に40×40サイズに再構成し、レネットとサイファーネットを使って訓練しました。私は「90%」の精度を得ました。今は64 * 160を再構成してレネットとサイファーネット私は両方のネットで何も修正しなかった。これらの結果を改善したいと思います。結果を改善する方法は、畳み込みレイヤーまたは完全に連結されたレイヤーを追加することです。 – BHAV247

+0

はい、おそらく90%以上を改善できます。しかし*何が*うまくいくかは、データセットに大きく依存します。たとえば、GoogleNetをMNISTデータセットに適用すると、重大な過大評価が発生する可能性があります。あなたがイメージセットを記述していないので、今日のCNNで使用されているさまざまな機能を研究し、データを試してみるより具体的なものを示唆することはできません。最初の場所。 – Prune

+0

私はこのデータセットについて私が一度説明したら、この質問をチェックできますか?http://stackoverflow.com/questions/37958451/caffe-how-to-improve-results-of-image-classification – BHAV247

関連する問題