0
私は、DTアルゴリズムを使用していくつかの予測/分類タスクを行いたいと思います。しかし、最適なパラメータを特定するためにグリッド検索メソッドを使用したくない場合は、どのようにパラメータの値(ツリーの深さや分割する最小サンプルなど)を決めることができますか?決定木アルゴリズムのパラメータを事前に選択するにはどうすればよいですか?
私は、DTアルゴリズムを使用していくつかの予測/分類タスクを行いたいと思います。しかし、最適なパラメータを特定するためにグリッド検索メソッドを使用したくない場合は、どのようにパラメータの値(ツリーの深さや分割する最小サンプルなど)を決めることができますか?決定木アルゴリズムのパラメータを事前に選択するにはどうすればよいですか?
できません。さもなければ、これらはハイパーパラメータではなく、単にモデルに組み込まれた定数です。何かがハイパーパラメータであるという全体の理由は、十分に確立された訓練/選択方法の欠如である。グリッド検索以外にも、ランダム検索、metaoptimization、ハイパーパラメータのベイジアン最適化などがありますが、これに限定されるものではありませんが、最終的には実行できません。
ありがとうございました。しかし、ロジスティック回帰とSVMの正則化パラメータはどうでしょうか?1つの先験的に言う任意のデフォルト値を選ぶのは一般的な習慣ではありませんか?そうであれば、DTではなく、DTの価値を拾うのはなぜ大丈夫ですか? – KubiK888
いいえ、一般的な方法ではありません。これはよくある間違いです。しかし、いくつかのモデルは、ハイパーパラメータの選択(線形SVMなど)とあまり敏感ではありません(dt)。より敏感です - チューニングの必要性 – lejlot