入力の形の問題を修正した後、私のプログラムを走らせたが、問題は、プログラムによって印刷された総損失があまりにも高いことである(例えば、クイックスタートチュートリアル)。Python TFlearn - 損失が高すぎる
私の目標は、過去のデータ(スコアがタグ付けされた10M以上のエントリがある)を使って将来のエントリの混雑を予測することです。トレーニングに問題はないはずです。ここで
は私のコードです: 私のExcelファイル
calculed_at , congestion
1 , 56
2 , 21
これは結果がどのように見えるかである(2列、100 000リーニュ)の外観のこの種を持っている(15エポック) :
Training samples: 50000
Validation samples: 0
....
--
Training Step: 40625 | total loss: 15.27961 | time: 17.659s
| Adam | epoch: 013 | loss: 15.27961 - acc: 0.7070 -- iter: 50000/50000
--
Training Step: 43750 | total loss: 15.66268 | time: 17.549s
| Adam | epoch: 014 | loss: 15.66268 - acc: 0.7247 -- iter: 50000/50000
--
Training Step: 46875 | total loss: 15.94696 | time: 18.037s
| Adam | epoch: 015 | loss: 15.94696 - acc: 0.7581 -- iter: 50000/50000
--
このような高損失の原因について考えてみませんか?印刷された精度があまりにも悪くないので、奇妙に思える。ご協力ありがとうございました。
編集:私はちょうど今しようとしたとき、私は合計280を超える損失(かろうじて上記0,3または以下の精度を)持っていたので、私は論文値を取ったとき、良い瞬間のようでした。
デバッグするにはcsvファイルを共有してもよろしいですか? –
すぐに私の心に打撃を与えることは、これが完全に線形なネットワークであることです。あなたがtflearn APIを見ると、あなたの起動はデフォルトで 'linear'になります。まずそれを非線形性に変更し、それが機能するかどうかを確認してください。 また、これは回帰であるため、なぜあなたの損失は「categorical_crossentropy」ですか?あなたの 'データ'と 'ラベル'の詳細を詳しく説明すると役に立ちます。 – jkschin
@jkschin私はtflearnにあまりにも慣れていない、私は線形の代わりに "softmax"を試みたが、それは良くはなかった。 categorical_crossentropyについては、クイックスタートのチュートリアルにあったので、私はそれを使用しました。データやラベルについて詳しく説明するとどういう意味ですか? –