私は、以下で読むことができる完全に畳み込み的なニューラルネットワークU-Netを持っています。さまざまな入力を使用した完全畳み込みネットワーク
私は、画像のピクセル毎の分類を行うためにそれを使用したいです。私はトレーニング画像を512x512と768x768の2種類のサイズで用意しています。私は、最初のステップではサイズ(256,256,256,256)、後者では(384,384,384,384)のサイズの反射パディングを使用しています。私は畳み込みの前に連続するパディングを行い、入力の大きさの出力を得る。
私のパディングは画像/入力のサイズに依存するので、私は一般化モデル(私はTorchを使用しています)を構築することはできません。
このような場合、どのようにパディングが行われますか?
私は深い学習に新しいです、どんな助けも素晴らしいでしょう。ありがとう。