私は顧客がキャンペーン(航空会社の場合)に加入するかどうかを予測しているバイナリ分類の問題を抱えています。分類の問題でダミー変数を取るのはいつですか?
私のデータセットは顧客名とキャンペーン名のレベルであり、検討中の変数は43個あります。
デシル(1から10)と教育レベル(0から5)のような変数があります。教育のレベルでは、4が2の2倍になるとは言えません。変数をどのように扱うべきですか?
私は、私はダミー変数にこれらを変換する場合、私は変数の重要度を確認することができますどのようにR. にロジスティック回帰、ランダムフォレスト、Xgboostを実行していますダミー変数(0または1)にこれらの変数を変換する必要がありますか(因子分析はエラーを投げている)