0

tf.train.batchに渡すと、要素の形状を厳密に定義する必要があります。そうでない場合はという形状のテンソルが存在する場合はDimension(None)と入力します。どのようにして、異なるサイズの画像をどのように訓練するのですか?テンソル:可変サイズの画像のバッチ

答えて

3

tf.train.batchの引数にdynamic_pad=Trueを設定できます。

dynamic_pad:ブール値。入力形状に可変寸法を許可する。指定された次元はデキュー時にパッディングされ、バッチ内のテンソルは同じ形状になります。

+0

それはうまくいった。ええ、私はそのような答えのために3日間周りを検索してきた知っている。 :D – haxtar

2

通常、画像は特定のピクセル数にリサイズされます。

さまざまなサイズの画像を処理するために、他のテクニックを使用することができます。例えば、顔認識およびOCRの場合、固定サイズのウィンドウが使用され、それが画像上を移動される。他のタスクでは、プール層またはリカレントニューラルネットワークを持つ畳み込みニューラルネットワークが役立ちます。

関連する問題