2017-01-13 15 views
0

私は不良の年齢がかなり低いデータセットを持っています。ロジスティック回帰の実行により良い結果が得られるように、SASを使用してそのようなデータセットのバランスをとる方法を提案できますか?以下はサンプルです。前もって感謝します!!SASデータのバランシングが良いと悪い

ID X1 X2 X3 X4 X5 Target 
1 87 400 2 0 0 0 
2 70 620 1 0 0 0 
3 66 410 3 0 0 0 
4 85 300 1 0 0 0 
5 100 200 4 0 0 0 
6 201 110 1 0 0 0 
7 132 513 3 0 0 0 
8 98 417 4 0 0 0 
9 397 620 1 0 0 1 
10 98 700 5 0 0 1 

答えて

0

あなたはバッズの割合をオーバーサンプリングして、オーバーサンプリングを修正するためにproc logisticscoreステートメント内prioreventオプションを使用することができます。オンラインでは、これをさらに進めるのに役立つたくさんの例があります。

+0

あなたの提案をお寄せいただきありがとうございます。私は過去数日で何かを探してみましたが、オーバサンプリングに関しては分かりませんでしたので、方法を見つけるために質問を投稿してください。何かを提案できますか?前もって感謝します – user6016731

関連する問題