2017-10-18 13 views
0

私は、MNISTデータセットを使って手書き数字認識用のConvNetを構築しています。私のコードはTheanoのバックエンドを使ってKerasで書かれています。出力クラスをTheano/Kerasの1つのカテゴリにまとめる

ConvNetは、クラスのサブセット(たとえば、数字 '1'と '2'のみ)を識別し、他のものを汎用の「不明な」クラスとして出力するように訓練したいと考えています。私はこれが"Distributed Neural Networks for Internet of Things: The Big-Little Approach"に記載されているので、これはTheanoで行うことができると知っていますが、私はこのテーマに関する文書や例を見つけることができません。

答えて

0

0,1,2,3,4,5などを0,1,2(2は "その他"を表す)に変換する目的関数の出力(Y_train)を変更します。実際に数字5と6などを予測したい場合は、0から始まるようにクラスのインデックスを再作成する必要があります.0は数字5に、1は数字6に、 2が「その他」になります。ここで

Keras MNIST exampleの修正版は、基本的にはストレートだけでいくつかの余分なラインとのレポから、です:

'''Trains a simple convnet on the MNIST dataset. 

Gets to 99.25% test accuracy after 12 epochs 
(there is still a lot of margin for parameter tuning). 
16 seconds per epoch on a GRID K520 GPU. 
''' 

from __future__ import print_function 
import keras 
from keras.datasets import mnist 
from keras.models import Sequential 
from keras.layers import Dense, Dropout, Flatten 
from keras.layers import Conv2D, MaxPooling2D 
from keras import backend as K 
import numpy as np 

batch_size = 128 
epochs = 1 

# input image dimensions 
img_rows, img_cols = 28, 28 

# the data, shuffled and split between train and test sets 
(x_train, y_train), (x_test, y_test) = mnist.load_data() 

############################### 
# This is the key... order is important! 
y_train[y_train<=4]=2 
y_train[y_train==5]=0 
y_train[y_train==6]=1 
y_train[y_train>=7]=2 

y_test[y_test<=4]=2 
y_test[y_test==5]=0 
y_test[y_test==6]=1 
y_test[y_test>=7]=2 

num_classes=3 
print(np.unique(y_train)) 
# [0 1 2] 
############################### 

if K.image_data_format() == 'channels_first': 
    x_train = x_train.reshape(x_train.shape[0], 1, img_rows, img_cols) 
    x_test = x_test.reshape(x_test.shape[0], 1, img_rows, img_cols) 
    input_shape = (1, img_rows, img_cols) 
else: 
    x_train = x_train.reshape(x_train.shape[0], img_rows, img_cols, 1) 
    x_test = x_test.reshape(x_test.shape[0], img_rows, img_cols, 1) 
    input_shape = (img_rows, img_cols, 1) 

x_train = x_train.astype('float32') 
x_test = x_test.astype('float32') 
x_train /= 255 
x_test /= 255 
print('x_train shape:', x_train.shape) 
print(x_train.shape[0], 'train samples') 
print(x_test.shape[0], 'test samples') 

# convert class vectors to binary class matrices 
y_train = keras.utils.to_categorical(y_train, num_classes) 
y_test = keras.utils.to_categorical(y_test, num_classes) 

model = Sequential() 
model.add(Conv2D(32, kernel_size=(3, 3), 
       activation='relu', 
       input_shape=input_shape)) 
model.add(Conv2D(64, (3, 3), activation='relu')) 
model.add(MaxPooling2D(pool_size=(2, 2))) 
model.add(Dropout(0.25)) 
model.add(Flatten()) 
model.add(Dense(128, activation='relu')) 
model.add(Dropout(0.5)) 
model.add(Dense(num_classes, activation='softmax')) 

model.compile(loss=keras.losses.categorical_crossentropy, 
       optimizer=keras.optimizers.Adadelta(), 
       metrics=['accuracy']) 

model.fit(x_train, y_train, 
      batch_size=batch_size, 
      epochs=epochs, 
      verbose=1, 
      validation_data=(x_test, y_test)) 
score = model.evaluate(x_test, y_test, verbose=0) 
print('Test loss:', score[0]) 
print('Test accuracy:', score[1]) 
関連する問題