0

潜在的なパス:可変サイズの画像を持つ畳み込みニューラルネットワークを訓練するための好ましい方法は何ですか?

  • を有するmaxと高さを検索し、画像は、標準的な平均サイズに画像をトリミング0
  • に過剰画素を設定します。
  • その他?
+0

実際には、平均ではなく、最小の写真のサイズに切り抜く必要があります。さもなければ、あなたはまだ可変サイズの画像を持っています。 – narn

+1

ゼロパディング以外に、境界を複製することも可能であり、時にはより有益です。 –

+1

パディングゼロによって、複製境界線がネットワークが学習しようとする可能性のある不要なパターンを作成します。入力サイズを修正し、すべての画像をそのサイズにリサイズします。 –

答えて

0

テンソルフローでは、プレースホルダシェイプをレイジー定義します。例:

input_pl = tf.placeholder(tf.float32, shape=(BATCH_SIZE, None, None, CHANNELS)) 

「なし」は可変サイズを示します。こうすることで、切り抜きによる情報が失われることはありません。また、パディングによって間違った情報を追加する必要もありません。

+1

埋め込みが「不正な情報」ではありません。実際、このプレースホルダーテンソルは、送信された最大のテンソルのモデルにパディングを追加することによって動作します。 – modesitt

+0

私はそれを知らなかったし、そうであれば私には心配だろう。バッチサイズが1の場合はどうなりますか?プレースホルダは、私の「最大の」テンソルが何であるかを決して知らないでしょう。 – Anjany

関連する問題