2017-08-07 8 views
2

私はDeep Learningを初めて使い、Kerasを使ってそれを学んでいます。私はこのlinkの指示に従って、MNISTデータセットを使用して手書き数字認識分類器を作成しました。匹敵する評価結果を見るという点ではうまくいきました。 Kerasのバックエンドとしてテンソルフローを使用しました。MNIST手書き数字分類器の予測

今、私は手書き数字で画像ファイルを読んで、同じモデルを使って数字を予測したいと思います。私は最初に255の深さで画像を28×28の次元に変換する必要があると思いますか?私の理解が正しかったかどうかはわかりません。もしそうなら、私はこの変換をPythonでどうやって行うことができますか?私の理解が間違っている場合、どんな種類の変換が必要ですか?

ありがとうございます!

答えて

1

私が知っている限り、これをPythonで動作させるには、28x28のグレースケールイメージにする必要があります。これは、MNISTを訓練するために使用された画像と同じ形状およびスキームであり、テンソルはすべて784(28 * 28)サイズのアイテムを想定しており、それぞれテンソルの0-255の値を入力として使用します。

イメージのサイズを変更するには、PILまたはPillowを使用できます。それはあなたが何をしたいなら、accessonを容易にするためにここにコピーthis SO postまたはthis page in the Pillow docs(前述の記事でWtowerによってリンクは、アスペクト比をリサイズし、維持を参照してください。

HTH!

乾杯、

-Maashu

+0

@Masshuありがとうございました!スケーリング部分に完全に応答します!グレースケール化のために、私は非常に便利なドキュメント(実際にはサイズ変更を同時に処理します):https://www.reddit.com/r/ learnpython/comments/4uzuym/convert_image_to_grayscale_with_pillow /(これをコメント内のテキストにリンクする方法はあまり分かりません) – kee

関連する問題