2013-04-03 24 views
5

機械学習の初心者です。教師付き学習、教師なし学習、強化学習について読んでいるうちに、以下のような質問が出てきて混乱しました。私は、監督下の学習、教師なし学習、強化学習である3つを以下で識別するのを助けてください。学習の教師あり学習、(ii)教師なし学習、(iii)補強学習

どのような種類の、いずれかの場合には、最高のは次の3つのシナリオについて説明します。

(I)コイン分類システムは、自動販売機用に作成されます。これを行うには、 の開発者は、アメリカの造幣局から正確なコイン明細書を入手し、 のサイズ、重量、金種の統計モデルを導出します。この場合、自動販売機はコインを分類するために機械を使用します。

(ii)コイン情報を取得するために米国のミントを呼び出す代わりに、アルゴリズムは に大量のラベル付きコインが表示されます。アルゴリズムは、このデータを使用して の決定境界を推測し、自動販売機がその コインを分類するために使用します。

(iii)コンピュータは、 を繰り返し再生し、最終的に敗北につながる動きにペナルティを課して戦略を調整することによって、Tic-Tac-Toeをプレイする戦略を策定する。

+3

これは宿題のように聞こえます。そうであれば、それに応じて少なくともタグ付けする必要があります。 –

+3

http://a1.phobos.apple.com/us/r30/CobaltPublic/v4/bd/c2/2a/bdc22a17-0243-30a9-ff33-f4c64a0b23ca/205-2184361167323353073-CS156_Problem_Set_1_Telecourse.pdf#!116627291 –

+0

@LarsKotthoff宿題タグは廃止されました。 –

答えて

2

たとえば、Xという行列で表されるデータセットがあるとします。 Xの各行は観測値(インスタンス)であり、各列は特定の変数(フィーチャ)を表します。

ベクトルy(観測に対応)がある場合は、教師あり学習のタスクです。

観測用のラベルがない場合は、Xデータセット自体に基づいて決定する必要があります。たとえば、コインを使用した例では、コインパラメータの正規分布のモデルを作成し、コインに異常なパラメータがあるとき(したがって、不正行為を試みる可能性がある)信号を送るシステムを作成することができます。この場合、コインが大丈夫か、詐欺の行為かを示すような監督者はいません。したがって、教師なし学習タスクです。

前の2つの例では、最初にモデルを訓練してから、モデルをそれ以上変更することなく使用しました。 補強学習処理されたデータとその結果に基づいてモデルが継続的に改善されます。例えば、ポイントAからポイントBへの道を探しているロボットは、まず移動のパラメータを計算し、次にこれらのパラメータに基づいてシフトし、新しい位置を分析して移動パラメータを更新して、次の移動がより正確になるようにすることができるポイントBに達するまで)。

これに基づいて、私はあなたがこれら3種類の学習とあなたのアイテムの間の対応を見つけることができると確信しています。

+0

教師あり学習 – user2201536

3

(I)教師なし学習 - 標識されたデータが利用できないよう

(ⅱ)教師あり学習 - あなたはすでに利用可能なデータをラベル付けしているとして、あなたが学び、どこ

(iii)は強化learning-に基づく再学習その行動からの行動と効果/報酬。

+0

(ii)「アルゴリズムは** ** **コインの大きなセットで提示されます」 – ffriend

+2

(i)は教師なしではありません。データの真の分布はわかっています。つまり、ベイズ最適決定ルールを得ることができます。ラベルされていないデータ - >監督されていないのはあまりにも単純なルールなので、正解は "上記のどれも"でなければならないと思う。監督されないようにするには、コインの束を提示する必要がありますが、どのインスタンスがどのタイプに属しているかに関する情報はありません。 –

+0

合意されていますが、与えられた3つの方法の中から1つの方法しか選択しなければならない場合、手元に情報がないので、教師なしの学習でなければなりません。 – marc

0

教師付きアルゴリズムでは、のクラスがあらかじめ決められています。これらのクラスは、これまでに人間によって到着した有限集合として考えることができる。実際には、データの特定のセグメントがこれらの分類でラベル付けされます。機械学習者の仕事は、パターンを検索して数学モデルを構築することです。これらのモデルは、データそのものの分散の尺度に関連する予測能力に基づいて評価されます。ドキュメントで参照されているメソッドの多く(ディシジョンツリー誘導、ナイーブベイズなど)は教師付き学習手法の例です。

教師なし学習者は、分類には含まれていません。実際、教師なし学習の基本的な作業は、分類ラベルを自動的に作成することです。監督されていないアルゴリズムは、それらがグループを形成するものとして特徴付けることができるかどうかを判定するために、データの間の類似性を求める。これらのグループはクラスタと呼ばれ、クラスタリング・マシンの学習テクニックの全ファミリがあります。

+0

良い説明ですが、あなたは強化学習がありません。 – 0xc0de

0

私は、Perceptron for Novicesに関する記事を書いています。私は、デルタルールの詳細については監督下の学習について説明しました。教師なし学習と強化学習についても簡単に説明します。興味があるかどうかを確認することができます。

「人工ニューラルネットワーク(パーセプトロン)の直感的な例自己駆動車から車/歩行者を検出」

https://www.spicelogic.com/Blog/Perceptron-Artificial-Neural-Networks-10

関連する問題