私の質問は、Sklearnで使用するDecision Treeアルゴリズムを選択することですか?sklearnで使用するDecision Treeアルゴリズムを選択できますか?
sklearnのユーザーガイドでは、最適化されたバージョンのCARTアルゴリズムが使用されています。
C4.5などの他のアルゴリズムに変更できますか?
私の質問は、Sklearnで使用するDecision Treeアルゴリズムを選択することですか?sklearnで使用するDecision Treeアルゴリズムを選択できますか?
sklearnのユーザーガイドでは、最適化されたバージョンのCARTアルゴリズムが使用されています。
C4.5などの他のアルゴリズムに変更できますか?
scikit-learn uses an optimised version of the CART algorithm.
を参照してください。しかし、我々は "ジニ" または "エントロピー" を使用するかを選択することができますのparams基準があります:
clf = tree.DecisionTreeClassifier(criterion="entropy")
基準:文字列、オプション(デフォルト= "gini") 分割の品質を測定する機能。サポートされる基準は、Gini 不純物の "gini"と情報利得のための "エントロピー"です。
は、あなたがそのことにより、正確に何を意味するDocs
を参照してください?欠損値とカテゴリ変数は現在処理されておらず、ポストプルーニングは行われておらず、事前プルーニングのみが行われています。 C4.5は実際にはアルゴリズムではありません、それはプログラムですよね? –