私はブラウザ内のこのオンラインデモで遊んできましたhttps://cs.stanford.edu/people/karpathy/convnetjs/demo/image_regression.htmlと私はテキストを使って画像を作ろうとしていました。読み取り可能なテキスト)を無駄にします。ニューラルネットワークをオーバーフィットする最良の方法は何ですか?
このニューラルネットワークは、ピクセルのX位置とY位置、および前記ピクセルの3つの出力 - RGBチャネルの2つの入力を受け取ります。ネットワークは選択された画像によって訓練され、次にそれを「描く」ことを試みる。
このネットワークは、各ピクセルが元のイメージに可能な限り近くなるように、つまりオーバーフィットになるように訓練したいと考えています。これはどのように達成できますか?どのような組み合わせやパラメータを使用すべきですか?多分、ネットワークの構造は異なっている必要があります(より多くの層、より多くのニューロンの層、異なる種類の層など)。
私は元からの構造を変更することなく、学習率で遊んで試してみたが、それでも400K回の反復の後のテキストのほとんどは区別がつかない:
は、それは単に時間の問題ですし、多分数百万回の反復後に望ましい結果が達成されるでしょうか?何とか(処理能力や他の明白なものを増やすことなく)スピードアップできますか?
毎回同じ入力に対して同じ値を返すようにするのは、本当に簡単な作業でなければならないと思われます。ネットワークは何百万回も正確に同じデータで訓練されています。灰色のピクセル?
私はニューラルネットワークを使い慣れていないので、多分それは愚かな質問であり、ニューラルネットワークはまったく使用できません。
セマンティックセグメンテーションを試しましたか? –
いいえこの特定のJSライブラリでどのように処理できるか教えてください。 –
私はこのJSライブラリについて知らないけど、私はCaffeの画像にセマンティックセグメンテーションを使用しました。 –