最近、私はthis postの結果を複製しようとしていますが、Kerasの代わりにTensorFlowを使用しています。しかし、私のモデルの損失はin the code providedとして収束していません。私は、明示的に示されていないものであっても、著者が使用したのと同じパラメータを使用するよう注意しました。私の完全なコードはhereです。Tensorflow - 損失が減少しない
私は既にさまざまな学習率、オプティマイザ、バッチサイズを試していますが、結果にはあまり影響しませんでした。
StackOverflowとStackExchangeにこの問題に関する他の質問がありましたが、ほとんどの回答はまったくありませんでした。しかし、答えのある質問は役に立ちませんでした。
私が最も奇妙なことは、我々は、同じデータベースと同じモデルが、ちょうど別のフレームワークを持っているということである10
TensorFlow 1.1.0、Pythonの3.6とWindowsを使用しています。したがって、それはまったく異なる振る舞いをするはずではありませんでした。誰にもこの問題を解決するために何を試してくれるべきかについての提案はありますか?
短いコメント:テスト中にドロップアウトを無効にするには、 "is_training'"を使用する必要があります。さらに、ネットワークが常にゼロを出力するように見えるので、グラデーションは無意味です。ドロップアウトを無効にしようとしましたか? –
なぜあなたの損失が二乗誤差平均であり、「ログ」と呼ばれるものに対してtanhがアクティブ化されているのですか? –
あなたは正しいです、@ JonasAdler、私はドロップアウトを使用していませんでした。なぜなら、 "is_training"のデフォルト値はFalseなので、出力は変わりませんでした。私は今それを真実にしようとしましたが、問題はまだ起こります。 –