1

私は最近、機械学習とニューラルネットワークを検討しており、トレーニングプロセスが生涯にわたってネットワークのパフォーマンスに及ぼす影響をよりよく把握しようとしています。ニューラルネットワークは、マークされたトレーニングセットよりも優れた性能を発揮できますか?

トレーニングセットが与えられると、ネットワークはバイアスポイントと重み変数を調整して、何千ものデータポイントを処理し、各ポイントで学習して調整するので、プログラムを正解に近づけるようにします。 Thisの論文では、データセットが正確に100%正確にマークされた97%までの正確な数を正確に推測するようにネットワークを訓練できるMNISTデータセットの例について説明しています。

ただし、指定されたデータセットが80%正確であるか、50%正確な場合はどうなりますか?この精度はトレーニング後にネットワークが達成できる精度の上限ですか?与えられたデータセットよりも鍛えることを可能にするモデルはありますか?

より良い例がないため、ニューラルネットワークが初心者のチェスプレイヤーから学んだ場合、理論的には壮大なレベルまで訓練することができますか?

答えて

2

短い答え:彼らは徹底的にノイズフィルタやその他の技術を使用して、いくつかのmislabledデータ、所定のネットワークを訓練するためのアプローチを説明する信頼できないラベルに基づいて、トレーニングNNについて語っチェックthis paper。彼らはMNISTデータセットでそれを実証しています。

長い回答:データは、それが与えられた設定どうなり何

しかしは、わずか80%の精度または50%正確ですか?一般的に

、我々はスチュアート・J・ラッセルとピーター・ノーヴィグによって(大きな)書籍Artificial Intelligence: A Modern Approach 3rd Ed.(P 732)から抽出し、ニューラルネットワークは、回帰に似ていると言うことができます:

と理由ネットワークに代表される機能 は、高非線形-構成することができ、そのままでは、ネストされた非線形のソフト しきい値の機能-我々は 非線形回帰を行うためのツールとしてニューラルネットワークを見ることができます。

したがって、このネットワーク(またはリグレッサー)にいくつかのデータを与えると、可能な限り最良の方法でそれを適合させようとします。つまり、ネットワークは先験的にを知ることができません現実世界のラベルは何になるでしょうか。それはあなたがそれを与えるデータに合うように訓練され、隠されたパターンを学び、入力の可能な変形に適応しようとする。だから、

、これを考慮し、伝統的なアプローチを、以下の(紙の1が好きではありません)あなたのNNを与える場合は、データをmislabledそれはmislabledデータのその種類を分類する方法を学習します(つまり、あなたの訓練誤差と損ですfuncitonは良いかもしれませんが、本当のラベルを付けると、mislabledのデータを分類するように訓練されたので、最悪の場合があります)。同じように誤ってデータを無効にしてパフォーマンスを試してみると、確かに優れたパフォーマンスを発揮します。

与えられたデータセットよりも訓練が良いモデルがありますか?

この論文はモデルを示しています。 NNの "train better"のような注意は、慎重でない場合はOverfittingになります。

これが役に立ちます。

1

はい - 理論上、ネットワークは入力よりも高い基準を達成できます。特に、入力がで、エラーがあるとわかった場合はとなります。とりわけ、「委員会による訓練」が個々のメンバーの正確さを上回る可能性は非常に高い。そのような場合、制御要因は、トレーニングセットの正確さが「ランダムな推測」をはるかに上回っていることです。ランダムまたはそれ以上に悪い場合は、失敗するでしょう。

非常に目に見える例は、クイズ番組「誰がミリオネアになるか」です。スタジオの視聴者は、トリビアや大きな賞品に過ぎない関心を持っている "普通の人"ですが、 "聴衆に聞いてください"というライフラインはhigh degree (91%) of accuracyです。

関連する問題