トレーニング中に入力画像を歪めるために使用されるTensorFlowには多数の画像操作があります。 tf.image.random_flip_left_right(image, seed=None)
およびtf.image.random_brightness(image, max_delta, seed=None)
などが挙げられる。TensorFlowバッチの画像操作
これらの機能は、単一の画像(すなわち、形状[高さ、幅、色チャンネル]の3次元テンソル)に対して作成されます。どのように画像(バッチ、高さ、幅、色チャンネル)の形状を持つ4次元テンソルで画像を処理するには?
実用的な例が大いにありがとう!
ありがとうございます! tf.imageの関数にこの組み込み関数がない理由はありますか?私は、tf.map_fn()から呼び出される単一の関数前処理()ですべての画像ひずみを作成しました。私はmap_fn()が新しい乱数を使ってpreprocess()を繰り返し呼び出すので、これによってランダムなひずみがすべての画像で異なると考えられます。あなたの答えと提案されたもう一つの違いとmap_fn()がより良い解決策である理由について詳しく説明してください。私は、実行時にtf.map_fn()ループをイメージ上に推測しているので、バッチ内の各イメージのグラフにopsは追加されません。 – questiondude
ありがとうございます。私はこれをして、それは働いた。しかし、トレーニングは変換なしの場合より5倍遅くなっているので効率的ではありません:-( –