2016-07-14 12 views
0

私はPythonでロジスティック回帰をSASと比較することで学んでいました。Pythonでロジスティック回帰の成功カテゴリを設定するにはどうすればよいですか?

データセット:http://www.ats.ucla.edu/stat/data/binary.csv

ここは認める応答変数であり、デフォルトでカテゴリ0と1

SAS = 0を認める確率に基づいてモデル化し、私はそれがないDESCオプションを指定した場合されていますそれは=上を認める1.

参考:http://www.ats.ucla.edu/stat/sas/faq/logistic_descending.htm

のpythonで、使用して統計モデルはデフォルトでADMIT = 1でモデル化されています.ADMIT = 0(イベント記述を変更)でモデル化すると、係数と予測される可能性の違いはわかりません。

ありがとうございました。

+0

は良い方法ではないようです。 – marupav

答えて

1

唯一の堅牢な方法は、希望のレベルを表す1の新しい0-1ダミー変数を作成することです。例えば

:ここで

not_admit = (ADMIT == 0).astype(int) 

「ロバスト」は例えばパンダ、パッツィとstatsmodels DTYPEが整数でない場合にカテゴリ変数を変更したり、フロートとの間の相互作用の現在の曖昧を指し文字列、ブール値またはオブジェクト。カテゴリ依存変数のこの処理は、数式と非数式のバージョン間で一貫性を持たせるため、後方互換性のない方法で変更する必要があります。

これについていくつかの問題がありますが、例えば0として、1と1などのイベント0を入れ替える https://github.com/statsmodels/statsmodels/issues/2733

+0

ありがとう。私も同様の考えを持っていました。 – marupav

関連する問題