1
examplekaggle_otto_nn.py
はKeras
で、バックエンドはtheano
です。次のプリントアウトで Keras:CuDNNは利用できませんか?
CNMeMは初期サイズで有効になっている:私は疑問に思って
、CuDNN利用できないメモリの90.0%、このCuDNN not available
を行います問題はGPUデバイスが検出可能なためですか?自分のプログラムをGPUで正しく実行していますか?それとも、実際にはGPUで動作していないのですか?
[email protected]:keras-examples$ THEANO_FLAGS=mode=FAST_RUN,device=gpu,floatX=float32,lib.cnmem=0.9 python kaggle_otto_nn.py
Using Theano backend.
/usr/local/lib/python2.7/dist-packages/Theano-0.8.0rc1-py2.7.egg/theano/tensor/signal/downsample.py:6: UserWarning: downsample module has been moved to the theano.tensor.signal.pool module.
"downsample module has been moved to the theano.tensor.signal.pool module.")
Using gpu device 0: Quadro K610M (CNMeM is enabled with initial size: 90.0% of memory, CuDNN not available)
Loading data...
9 classes
93 dims
Building model...
Training model...
Train on 52596 samples, validate on 9282 samples
Epoch 1/20
52596/52596 [==============================] - 6s - loss: 0.9420 - val_loss: 0.6269
Epoch 2/20
52596/52596 [==============================] - 6s - loss: 0.6955 - val_loss: 0.5817
...
Epoch 20/20
52596/52596 [==============================] - 6s - loss: 0.4866 - val_loss: 0.4819
Generating submission...
144368/144368 [==============================] - 1s
Wrote submission to file keras-otto.csv.
しかし、私はそれがより遅いとは思わなかった。私は新しいcuDNNパッケージをダウンロードし、私のcudeパスにファイルをコピーします。私は再びそれを実行した後、cuDNNは利用可能ですが、まだ同じ速度で。私の場合は、各エポックごとに常に6秒です。 – fluency03