私が弱い学習者(特にAdaBoostに関連して)について学んだことは、トレーニングデータの配布にエラー< 1/2が必要であると言います。私はこれを誤解しなければならないと思うので、以下の論理の欠陥を誰かが指摘できるのであれば、私は感謝するでしょう。弱い学習者は実際にANY分布に対して<1/2の誤差がありますか?
弱い学習者がただ1つの例を誤って分類する(xと呼ぶ)。次に、この例ではxが100%、他のすべての例で0%の重みを持つ分布を考えてみましょう。明らかに、弱い学習者は、この分布について1より小さい1/2の誤差を有することになる。定義を理解することで、それは実際には弱い学習者ではないことを意味します。したがって、弱い学習者が1つのサンプルデータであっても誤分類した場合は、いずれの分布に対してもエラー< 1/2を持つことはできません。しかし、それは、弱い学習者が完璧でなければならないことを意味します。私が知っているのは、弱い学習者のブースターアンサンブル全体を無視しているだけであり、狂った話です。
弱い学習者がすべての配布に対してエラー< 1/2を持つことを誤解する必要があります。 "any"は実際に何を意味しますか?
弱い学習者には1つの要件しかありません。ランダムな推測よりも優れている必要があります(エラー== 0.5と思われます)。あなたのサンプルを扱うのは難しいです。なぜなら、それは複数のサンプルについてではなく「アクション」についてのものなのですから。少なくとも私の理解に。 – sascha