2017-10-29 12 views
0

私は、7つの異なる共変量と出力変数「成功率」を含むデータセットを持っています。 私は成功率を予測する重要な要素を見つけようとしています。私のデータセットの共変量の1つは、700の値(0〜700)を取るカテゴリ変数です。それぞれは、自分が属する地区のIDを表します。 ロジスティック回帰の実行中にこの変数をどのように扱うべきですか? ダミー列を700個作成した場合、どうすれば結果をより簡単に解釈できますか? 私はPythonとstatsmodelsを使用しています。ロジスティック回帰 - Pythonでカテゴリ変数を扱う?

+1

データを追加します。説明は必要ありません。データが必要です。どのようにデータがどのように見えるかわからないと何が示唆できますか? – Dark

答えて

1

グループ化を適用し、各グループに対してロジスティック回帰を実行できます。または、マルチラベル分類器として扱い、「Softmax回帰」を行います。

関連する問題