0

あなたが知らない人がいる場合、敵対的な画像は、あるクラスに属し、視覚的に人間の目に知覚的な違いがなく歪んだ画像ですが、ネットワークはそれを誤って認識しますまったく異なるクラスです。ここではそれについて機械学習(反抗的画像)

詳細情報:TensorFlowを使用して http://karpathy.github.io/2015/03/30/breaking-convnets/

、私は畳み込みニューラルネットワークについて多くのことを学びました。

def weight_variable(shape): 
    initial = tf.truncated_normal(shape, stddev=0.1) 
    return tf.Variable(initial) 

def bias_variable(shape): 
    initial = tf.constant(0.1, shape=shape) 
    return tf.Variable(initial) 

def conv2d(x, W): 
    return tf.nn.conv2d(x, W, strides=[1, 1, 1, 1], padding='SAME') 

def max_pool_2x2(x): 
    return tf.nn.max_pool(x, ksize=[1, 2, 2, 1], 
         strides=[1, 2, 2, 1], padding='SAME') 

W_conv1 = weight_variable([5, 5, 1, 32]) 
b_conv1 = bias_variable([32]) 

x_image = tf.reshape(x, [-1,28,28,1]) 

h_conv1 = tf.nn.relu(conv2d(x_image, W_conv1) + b_conv1) 
h_pool1 = max_pool_2x2(h_conv1) 


W_conv2 = weight_variable([5, 5, 32, 64]) 
b_conv2 = bias_variable([64]) 

h_conv2 = tf.nn.relu(conv2d(h_pool1, W_conv2) + b_conv2) 
h_pool2 = max_pool_2x2(h_conv2) 


W_fc1 = weight_variable([7 * 7 * 64, 1024]) 
b_fc1 = bias_variable([1024]) 

h_pool2_flat = tf.reshape(h_pool2, [-1, 7*7*64]) 
h_fc1 = tf.nn.relu(tf.matmul(h_pool2_flat, W_fc1) + b_fc1) 

keep_prob = tf.placeholder(tf.float32) 
h_fc1_drop = tf.nn.dropout(h_fc1, keep_prob) 


W_fc2 = weight_variable([1024, 10]) 
b_fc2 = bias_variable([10]) 

y_conv = tf.matmul(h_fc1_drop, W_fc2) + b_fc2 

課題は、入力にも「2」とラベル番号2の画像であり、出力は「6」として識別なるように何とか差ようにわずかに画素を変える、この画像を畳み込みます認識できません。

どこから始めたらいいですか?

+0

まず、敵対的な例を生成する方法を説明した論文を実際に読んで始めてください。 –

答えて

1
あなたはこの論文を読むことによって開始することができ

https://arxiv.org/abs/1412.6572(たとえば)

それは、入力に対する損失関数の勾配を計算することによって、敵対例を生成するための方法の一つを説明しています。

により、たとえば、クロスエントロピーは、あなたの損失関数を定義した後、あなたのような何かをtf.gradients()

を見てください:

grads = tf.gradients(loss, [x])[0] 
signs = tf.sign(grads) 
epsilon = tf.constant(0.25) 
x_adversarial = tf.add(tf.multiply(epsilon, signs), x) 

x_adversarialあなたの卑劣な画像になります。追加されたノイズの大きさを設定するepsilonの値で再生することができます。