0
sklearn.tree.export_graphiz()
を使用する場合、エクスポートされたツリーノードのラベルには、samples
とvalue
などの統計的メタデータが含まれます。統計的メタデータなしでscikit-learn DecisionTreeClassifierをレンダリングしますか?
私はこのデータなしでユーザーにツリーのバージョンを表示したいと思います。つまり、length <= 7
のような判断基準と分類自体だけがノード内に表示され、それ以外は表示されません。
export_graphviz()
で可能ですか?私が見ているのは、スコアimpurity
を削除するためのキーワードオプションですが、他の統計情報は削除されていません。
ソースを見ると、これらの他の統計情報を除外する設定パスはないようです。 DOTファイルのデータを解析し、要件に合わせてノードラベルを変更することで、DOTファイルのデータを後処理する必要があるかもしれません。 –
さて、 'label'というパラメータがあります。これを' None'に設定すると、すべてのノードの不純物などの有益なラベルが隠されます。多分それが助けることができます。 –
@VivekKumar:はい、ありがとう、そのパラメータが存在します。残念ながら、ツリーノードからすべての統計的メタデータを削除するわけではなく、データの*ラベル*だけを削除するので、それは私には十分ではありません。 –