2011-07-23 13 views
2

ウィキペディアにはID3 algorithmという定義がありますが、それは非常に複雑です。コンセプトを簡単に説明できるリンクはありますか?ウィキペディアには複雑な理論や数式がたくさんあります。私は萎縮が何であるかを理解しました。しかし、私はゲインとは何かを理解していませんでした。あなたの基本的な説明や良いリンクへのポインタは間違いなく私を助けます。事前にID3アルゴリズムを理解できません

感謝:)

+1

おそらく少なくともwikiページへのリンクが含まれていますか? –

+0

@Mitch:id3アルゴリズムをgoogleに入力すると、最初のリンクだと思っていました。とにかく、ここにそれがあります:http:// en.wikipedia.org/wiki/ID3_algorithm' – TCM

+0

また私はこのリンクから参照しようとしましたが、それは私の頭の上に行きます: 'http://web.arch.usyd.edu .au /〜wpeng/DecisionTree2.pdf' – TCM

答えて

6

いくつかの例が参考になるけれども、私は、Wikiページに基本的に釘概念を考えます。このトピックについてthe U Florida pagethe ICLページを確認できます。そのような話題(機械学習とデータマイニング)については、いつも役に立つと思うreading materials by Andrew Moore @ CMUと考えるべきです。

しかし、また、ここに私の2セントです:

エントロピーは、メッセージに含まれる情報(不確実性)の期待値を示しています。ここでデシジョンツリーを検討しているので、ゲインは、属性(すなわち、元のエントロピーと異なるブランチのエントロピーの重み平均との差)を分割したときのエントロピーの差です。これは不確実性の低減であるため、これはその属性を分割することによって得られた情報に過ぎません。

また、私たちは、データマイニングコースを行ったときに、データマイニング:チュートリアルベースのアプローチをテキストとして使用しました。これは良いと簡単な本です。

関連する問題