私はTensorflowの初心者です。私はチュートリアルで少し混乱しています。著者は最初に数式y = softmax(Wx + b)を与えますが、PythonコードでxW + bを使用し、小さなトリックであることを説明します。私はトリックを理解していない、なぜ作者は数式を反転する必要がありますか?テンソルフローを使ったMNIST実験のトリックを理解するには?
https://www.tensorflow.org/get_started/mnist/beginners
まず、我々は、発現tf.matmul(X、W)とのWによってXを掛けます。これは の入力を持つ2Dテンソルであるxを扱う小さなテクニックとして、をWxに持っていた我々の方程式でそれらを掛けたときに反転された です。次に、bを追加し、最後にtf.nn.softmaxを適用します。