KerasのImageDataGenerator
によって生成された画像を、そのキャプションを生成するLSTMに供給しようとしています。現在、train
フォルダには、image1.jpg, image1_caption, image2.jpg, image2_caption, ...imageN.jpg, imageN_caption
の順に情報が格納されています。ケラスで生成された画像の順序
ただし、 1.画像ファイルごとに何枚の画像が生成されているかわかりません(フリップ、ズーム、回転)。 2.バッチ内のバッチとサンプルは画像1に対応しています。 shuffle = False
と設定しても、役に立たないようです。
基本的には、に対応するバッチとサンプルを知りたいので、LSTMに入力してimageN_caption
と一致させることができます。
train_datagen = ImageDataGenerator(
rescale=1./255,
rotation_range=5,
zoom_range=0.2,
horizontal_flip=True)
img_height = img_width = 224
train_generator = train_datagen.flow_from_directory(
'./train/',
color_mode = "rgb",
target_size=(img_height, img_width),
batch_size=32,
shuffle = False,
class_mode=None)
i = 0
img_list = []
for batch in train_generator: #.flow(x, batch_size=1)
img_list.append(batch)
i += 1
if i > 5:
break