https://github.com/slavaglaps/ResNet_cifar10/blob/master/resnet.ipynbこれは私のモデルは同様のモデルに 精度100のエポックで訓練されている50
小検証精度ResNetと同様のデータは、私の問題は何である90% に達しますか? 私は、エポックの経過とともに学習率を下げる価値があると思います。 私はそれが私を助けることができると思いますか?
https://github.com/slavaglaps/ResNet_cifar10/blob/master/resnet.ipynbこれは私のモデルは同様のモデルに 精度100のエポックで訓練されている50
小検証精度ResNetと同様のデータは、私の問題は何である90% に達しますか? 私は、エポックの経過とともに学習率を下げる価値があると思います。 私はそれが私を助けることができると思いますか?
微妙な違いがいくつかあります。
ImageNetスタイルのアーキテクチャをCifar-10に適用しようとしています。最初の畳み込みは3 x 3
であり、7 x 7
ではありません。 max-poolingレイヤはありません。画像は、ストライド-2コンボリューションを使用して純粋にダウンサンプリングされます。
featurewise_center = True
をImageDataGenerator
に保存することで、平均的なセンタリングが行われるはずです。
[512,1024,2048]などの非常に多くのフィルタを使用しないでください。 ImageNetと違って、あなたは約50,000の画像しか訓練することができません。
つまり、deep residual network paperのセクション4.2を読んで、ネットワークを複製しようとしてください。また、thisブログを読むこともできます。
類似モデルと同様のデータが90%に達しました - ここにソースを指定してください/より具体的にここに –
他の人はアンサンブル/テスト時間の延長を使用していませんか? –
'x_train = x_train/255' - ' x_train'の 'dtype'は何ですか? Intまたはフロート? (それを確認してください;推測しないでください - あなたが 'scipy.misc.imshow'で可視化して、データが正しくロードされていることを確認することもできます) –