私は深く学びながら新しいです。私はcaffeを使い、トレーニングのためのデータセットを準備する予定です。深い学習のためにイメージが同じサイズでなければならないのですか?
すべての画像は同じサイズでなければなりませんか?そしてそれは雄大でなければなりませんか?
もしそうなら、理想的なサイズや選択方法は?
私は深く学びながら新しいです。私はcaffeを使い、トレーニングのためのデータセットを準備する予定です。深い学習のためにイメージが同じサイズでなければならないのですか?
すべての画像は同じサイズでなければなりませんか?そしてそれは雄大でなければなりませんか?
もしそうなら、理想的なサイズや選択方法は?
通常、深い学習の場合、これは必須ではありません。畳み込みニューラルネットワークは画像サイズに依存せず、フィルタはすべての画像サイズに適用することができます。
まだ多くのフレームワークと文字通り、すべての論文で同じイメージサイズがトレーニングに使用されています。 https://arxiv.org/pdf/1409.1556/では、彼らはネットワークを評価するために異なるサイズを使用しました。これを実現するには、サイズ変更または作物のいずれか、またはその両方の組み合わせを使用できます。アスペクト比を変更することは、ほとんど常に悪い考えです。
良い画像サイズを選ぶには、画像のサイズを大きくすると、より正確な精度が得られることに注意してください。しかし、すべてのフィルタが長くかかり、画像サイズとともにメモリ要件が増加します。さらに大きなサイズは、改善を減少させる。私は通常224x224を使用します。なぜならそれはしばしば2で割り切れるからです。そしてimagenetもそれを使います。
最終的に画像サイズは正方形である必要はありませんが、CNNは画像サイズを半分にカットし、しばしば4x4や6x6のようなものになることが多いため、ほとんどの場合、良いアイデアです。これを非正方形の開始サイズで行うと、4x2や6x3のような終わりの大きさが得られます。
完全な畳み込みネットワークでは、トーマスの言葉に加えて、自由に訓練することができ、任意のサイズでネットワークをテストできます。固定画像サイズでの深い学習作業から始めましょう。 – Feras