制度上、SASを使用するように制約されています(はい、わかります)。私はStata/Rで動作する基本仕様を持っています:分数ロジットモデル(Papke Wooldridge 1996)。これは、2項分布仮定とロジットリンク関数を持つGLMです。データコンテキストは、単位区間 - パーセンテージデータの定常時系列である。 StataのでSASの分数ロジットモデル
これは簡単にそれが
のproc GLIMMIXを使用してSASでこれを実行しようとすると、aModel <- glm(Y ~ X, family=binomial(link=logit), data = aDataFrame)
であるRに
glm Y X, family(binomial) link(logit)
として実行されます。
proc glimmix data =aDataTable method = rspl;
class someClassifier anotherClassifier;
model Y = X/dist = binomial link = logit SOLUTION;
random _residual_;
run;
私が扱っていますRやStataの構文では問題にならないが、proc glimmixに必要な情報であるように見えるパネルデータセットでは、私の包含「クラス」のラインの。私は、Stata/Rからのオリジナルにかなり近いモデルを適合させることができますが、個別のパラメータや予測値を見たときの非自明なやり方は異なります(異なる予測値間の相関は約0.97です)。誰でもSASの分数ロジットを行う適切な方法についてアドバイスできますか?私は、上記のように「ランダム」ラインを含めることが問題の原因の1つであると考えています。これは余分な行列*ベクトル演算を介してモデルにランダムな効果を加えるようです。
MODEL文の一部ではないCLASS文に変数を追加するのはなぜですか?また欠損値がありますか? – Tom