私はsklearnクラスDecisionTreeClassifierを使っていました。クラスのパラメータを見るとsklearnのmin_samples_splitとmin_samples_leafの違いDecisionTreeClassifier
は、我々は、2つのパラメータmin_samples_splitとmin_samples_leafを持っています。それらの背後にある基本的なアイデアは同じように見えます。ノードを葉にするか、さらに分割するかを決めるのに必要なサンプルの最小数を指定します。
なぜ私は2つのパラメータが別のものを意味するのでしょうか?それらを区別する理由やシナリオはありますか?ドキュメントから
https://discuss.analyticsvidhya.com/t/what-does-min-samples-split-means-in-decision-tree/6233/2 –
@Abhishek、リンクありがとうございます。アレックスとリンクの両方が今私がそれを理解するのを助けました。 –
もう一つの大きな議論があります。ダイアグラムはhttps://github.com/scikit-learn/scikit-learn/issues/8399 – cardamom