の計算:...、すなわち私はエントロピーを計算するための式を知っていますデシジョンツリー内のエントロピー(機械学習)
H(Y) = - ∑ (p(yj) * log2(p(yj)))
を属性を選択し、それぞれの値のチェック対象の属性値のため ので、P(YJ)ノードNのパターンの割合はカテゴリyjにあります.1つはターゲット値が真、偽が1つです。
しかし、私はtarget属性がprice、したがってrangeであるデータセットを持っています。このようなデータセットのエントロピーを計算するには?
は(表記:http://decisiontrees.net/decision-trees-tutorial/tutorial-5-exercise-2/)
どのように範囲を決定できますか?データをソートし、範囲を決める方法を考えてみましょう。 –
これには多くの方法がありますが、私は答えに多くの情報を追加してくれます... –
属性は2つの値を持つバイナリ...感謝@Vicスミス! –