私はニューラルネットワークを実装しようとします。私はバックプロパゲーションを使ってグラジエントを計算しています。勾配を得た後、それらを学習率で乗算し、対応する重みからそれらを減算する。 (基本的に勾配降下を適用しようとすると、これが間違っているかどうか教えてください)。 backpropagationとgradient descentを準備した後で最初に試したのは、入力が(0,0)、(1,0)、(0,1)、(1,1) )、対応する出力は0,1,1,0です。したがって、私のニューラルネットワークは、2つの入力ユニット、1つの出力ユニット、および3つのユニットを持つ1つの隠れたレイヤーを含んでいます。 > 100(> 5000を試したとしても)の学習率3.0で学習すると、コストは特定のポイントまで下がりますので、一定のままです。ウェイトはプログラムを実行するたびにランダムに初期化されますが、常に同じ特定のコストでスタックされます。とにかく、訓練が終了した後、上記の入力のいずれかで自分のニューラルネットワークを実行しようとしましたが、出力は常に0.5000です。私は入力と出力が(-1、-1)、(1、-1)、(-1,1)、(1,1)と出力-1,1,1、 1。今では同じ学習率で訓練を受けた場合、反復回数に関係なくコストは連続的に低下していますが、結果はまだ間違っており、常に0に非常に近い傾向にあります。 [反復:(20kk)、入力:(1、-1)、出力:(1.6667e-08)]および[反復:(200kk)、入力:(1、-1) 、出力(1.6667e-09)]も入力(1,1)などで試してみましたが、出力も0に非常に近いです。出力は常に平均(min(y)、max(y) )、私は入力/出力をどのような形式で提供するかは重要ではありません。私は何が間違っているのか分かりません。助けてもらえますか?ニューラルネットワーク奇妙な予測
答えて
あなたは間違っているかもしれないので、多くの場所があります。
- は数値的に
- あなたはXORを学ぶために、非線形隠れユニットを使用する必要があなたのグラデーションをチェック - あなたがそこに非線形の活性化を持っているのですか?
- バイアスニューロンが必要ですか?
ような問題を引き起こしてはならない軽微なものを、しかし価値のいずれかの方法を固定:
- あなたは(あなたのネットワークが分類器であるとして)、出力ノードにおけるシグモイド活性化を持っていますか?
- クロスエントロピーコストでトレーニングしますか(これは軽微な問題ですが)。
私のコードをチェックすれば、私はベクトル化された実装を使用していますが、私は常に乗算の前にアクティベーションマトリックスに1の列を追加しますそれは重みマトリックスの転置で、そう私はバイアスニューロンを使用しています。すべてのニューロンはシグモイド活性化を使用します。はい、私はクロスエントロピーコストを使用します。非線形の隠れユニットに関しては、私はあなたがそれによって何を意味するのか理解できないのではないかと思います。 – cuvidk
あなたは数値的にグラデーションをチェックしましたか?より典型的な学習率(1e-3のような)を使ってみましたか?あなたはまた、regularizationFactor = 0(私はあなたが現在使用しているか分からない)を設定する必要があります – lejlot
私はちょうど1e-3を学習率、同じ結果として試しました。私はグラデーションを数値的にチェックしていませんでしたが、私はその方法を今考えています。現在の実装では実行が困難になります。 – cuvidk
- 1. マルチステップ予測ニューラルネットワーク
- 2. R h20ニューラルネットワークの予測予測
- 3. ニューラルネットワークの予測R
- 4. Artifcialニューラルネットワークの予測
- 5. ニューラルネットワークmatlabトレーニング後の予測
- 6. ニューラルネットワーク回帰予測のカットオフ
- 7. 自己実現ニューラルネットワーク奇妙な収束
- 8. Rパッケージ予測のauto.arimaの奇妙な振る舞い
- 9. ニューラルネットワークによる時系列予測
- 10. LSTMニューラルネットワークで間違った予測
- 11. Vb.Netへの奇妙なSendKeys観測
- 12. MNISTデータセットを予測する際に奇妙な値を取得する
- 13. neuralnetの予測関数が奇妙な結果をもたらす
- 14. Javaの奇妙な予期せぬIndexOutOfBounds
- 15. なぜニューラルネットワークは予測しないのですか?
- 16. ニューラルネットワーク高い信頼度の不正確な予測
- 17. 多層ニューラルネットワークは負の値を予測しない
- 18. ニューラルネットワークから正確な予測を得るには
- 19. ニューラルネットワークのケラス負荷重み/予測時の誤差
- 20. 予測のためのTensorflowの畳み込みニューラルネットワーク
- 21. 特定の日付にエネルギーを予測するためのニューラルネットワーク
- 22. 人工ニューラルネットワークはスポーツゲームの結果を予測できますか?
- 23. Keras - 1つのニューラルネットワークから2つの予測を作成
- 24. Tensorflow - ニューラルネットワークは常に同じことを予測
- 25. 人工ニューラルネットワークを使用した温度予測
- 26. 畳み込みニューラルネットワークが歪んだ予測を作成
- 27. ニューラルネットワークは、1個のニューロンと悪い予測
- 28. Rのニューラルネットワークは株価を予測するために
- 29. 推測された型での奇妙な反射エラー
- 30. jsの奇妙なJSON解析動作 "予期しないトークン"
エラーがあるので、コードを入力してください。 – lejlot
@lejlotここにコードがあります:https://github.com/cuvidk/yaann-api – cuvidk