SAS

2016-10-03 12 views
1

における因果関係-基準に基づいて回帰分析の変数を除外し、私は私の質問への答えのためにウェブを検索するために全力を行っているが、いずれかを見つけることができませんでした。たぶん私は正しい方法で求めていない、またはおそらく私の問題は解決することはできません...まあ、ここには何も行きません!SAS

SASで回帰を実行しているとき、後方または前方選択を行うことで重要ではないすべての重要でない変数を排除することは可能ですが、変数のp値が0.05以下であるため、結果が正しいことを確認します。

などです。、私は従属変数は、病気や医師の独立変数ビーイング番号に死亡数であることをSASで回帰を実行します。医師の数が上昇すると、死亡者数も上がることを、結果は0.05≤pで重要であるが、係数は述べています。これはおそらく、スプリアス回帰の結果だろうが、因果関係は間違っているが、SASはコンピュータであり、因果関係は行くだろうどの方法を知りません。 (もちろん、それは事実かもしれません、もっと多くの医師=他の何らかの要因による死亡者が増えますが、それは今のところ無視してください)。

私の質問は:回帰を行い、SASに後方/前方削除を行わなければならないと伝えることができますか?私が設定したいくつかのルールに従って、これらのルールに合致しない変数?例えば。死者が増えると、医者の数が増えるにつれ、医師の可変数を除外しますか?そして、それは

私は実際には、私は50以上の変数で回帰を実行しているので、私はすべての結果を通過する必要はありませんでした私自身。

ありがとうございました:)

+0

追加のルールを適用するシステムを構築するために、SASを拡張することは可能です。私。変数の数が100より多い場合はp <0.05であるが、p <0である。マクロの言語を使用して%doループを作成し、いくつかの条件が満たされている間にそれを実行し続けると、#of variables <= 100になります。 しかし、これは時間のコミットメントのビットかもしれません。 – JJFord3

答えて

0

私はこれが可能であるとは思わしくありません。前述のように、SASはコンピュータであり、どの回帰結果が偽であるかを知ることはできません。より多くの医者=より多くの医療処置=より多くの死があればどうなりますか?明らかに、各状況に専門家の意見を適用する必要がありますが、上記のシナリオは同じように考えられます。

また、私が正しいんだ場合は、実際の数ではありません「ドキュメントの共有」を言及?したがって、このメトリックがどのように計算されるかは、アーティファクトかもしれません。

排除したい特定のルールセットがある場合は、それを可能にすることができます。しかし、最初にすべてのルールを定義し、そのルールを確実にしなければなりません。

+0

あなたは正しいです。私は私の質問で十分に明確ではなかった。私はいくつかのルールを設定したいが、どのようにルールがわからない。私は私の質問を修正しますありがとう:) – BitteB

+0

私はあなたが示唆していることを行う統計的に有効な方法だとは思わない。 – Reeza

0

異常なパラメータ選択基準を指定する必要がある場合は、いつでもブルートフォースで独自のマシン学習をロールバックすることができます:データを分割し、マクロループ内のすべてのパーティションに対して異なる回帰モデルを実行し、AICモデル。

しかし、機械学習の専門家でなければ、恐らくproc glmselectのようなものから始めるのが最善でしょう。

SASは、前方選択とglmselect手順で後方排除、両方を行うことができます。例:

proc gmlselect data=...; 
model .../select=forward; 
... 

また、両方のアプローチを組み合わせることも可能である - すなわち、異なるとそれぞれ、マクロループにproc glmselectのいくつかの反復を実行しますモデルの仕様を確認し、最良の結果を選択します。