機械学習の初心者です。教師付き学習、教師なし学習、強化学習について読んでいるうちに、以下のような質問が出てきて混乱しました。私は、監督下の学習、教師なし学習、強化学習である3つを以下で識別するのを助けてください。学習の教師あり学習、(ii)教師なし学習、(iii)補強学習
どのような種類の、いずれかの場合には、最高のは次の3つのシナリオについて説明します。
(I)コイン分類システムは、自動販売機用に作成されます。これを行うには、 の開発者は、アメリカの造幣局から正確なコイン明細書を入手し、 のサイズ、重量、金種の統計モデルを導出します。この場合、自動販売機はコインを分類するために機械を使用します。
(ii)コイン情報を取得するために米国のミントを呼び出す代わりに、アルゴリズムは に大量のラベル付きコインが表示されます。アルゴリズムは、このデータを使用して の決定境界を推測し、自動販売機がその コインを分類するために使用します。
(iii)コンピュータは、 を繰り返し再生し、最終的に敗北につながる動きにペナルティを課して戦略を調整することによって、Tic-Tac-Toeをプレイする戦略を策定する。
これは宿題のように聞こえます。そうであれば、それに応じて少なくともタグ付けする必要があります。 –
http://a1.phobos.apple.com/us/r30/CobaltPublic/v4/bd/c2/2a/bdc22a17-0243-30a9-ff33-f4c64a0b23ca/205-2184361167323353073-CS156_Problem_Set_1_Telecourse.pdf#!116627291 –
@LarsKotthoff宿題タグは廃止されました。 –