2016-05-17 4 views
0

私が弱い学習者(特にAdaBoostに関連して)について学んだことは、トレーニングデータの配布にエラー< 1/2が必要であると言います。私はこれを誤解しなければならないと思うので、以下の論理の欠陥を誰かが指摘できるのであれば、私は感謝するでしょう。弱い学習者は実際にANY分布に対して<1/2の誤差がありますか?

弱い学習者がただ1つの例を誤って分類する(xと呼ぶ)。次に、この例ではxが100%、他のすべての例で0%の重みを持つ分布を考えてみましょう。明らかに、弱い学習者は、この分布について1より小さい1/2の誤差を有することになる。定義を理解することで、それは実際には弱い学習者ではないことを意味します。したがって、弱い学習者が1つのサンプルデータであっても誤分類した場合は、いずれの分布に対してもエラー< 1/2を持つことはできません。しかし、それは、弱い学習者が完璧でなければならないことを意味します。私が知っているのは、弱い学習者のブースターアンサンブル全体を無視しているだけであり、狂った話です。

弱い学習者がすべての配布に対してエラー< 1/2を持つことを誤解する必要があります。 "any"は実際に何を意味しますか?

+0

弱い学習者には1つの要件しかありません。ランダムな推測よりも優れている必要があります(エラー== 0.5と思われます)。あなたのサンプルを扱うのは難しいです。なぜなら、それは複数のサンプルについてではなく「アクション」についてのものなのですから。少なくとも私の理解に。 – sascha

答えて

1

2クラスの問題では、ランダムな学習者は誤差= 0.5になります。実際には、これは最悪のエラーです。これは、0.5以上のエラーを持つ学習者をまったく逆に編集することができるためです。反対の学習者エラーは1(最初の学習者のエラー)になります。 さらに、1つの例での誤差の測定は非常に問題があり、真の誤差を正しく表していない可能性があります。 したがって、最悪の誤差が0.5である場合(いずれの学習者にも誤差が0.5未満になることがわかったので)、ブースティングは、弱い学習者それぞれを組み合わせて「ブースト」するためには、少し精度が必要でした。

+0

右の場合、ランダムな学習者はerror = 0.5になります。しかし、特定の学習者がそれを悪用することができます、もしそれが対立的な分布に分類されていれば、正しいでしょうか?したがって、「弱い」学習者は一様分布の場合にエラー率<0.5でなければならないという要件だけがありますか?私はそれが_ANY_配布のためになければならないと聞いたとき、誤解していたに違いない。 –

関連する問題