2017-08-20 3 views
-1

私のパネルデータに自己相関の問題があります。 だから私はこの問題を扱う最初の違いの方法を使用することに決めました。自己相関の問題を解決するための第1の差分法のバイナリ変数の扱い

私の独立変数のほとんどはバイナリです。 これを超えて有限差分法を実行すると、 以前のように0または1の代わりに-1,0、および1が得られます。

これは問題ありませんか?ソート

 Date ID X Y Z L M A B C D E 
01/01/2017 A 0 1 0 0 0 0 1 0 0 7.8 
01/01/2017 A 0 1 0 0 0 1 0 0 1 6.5 
01/01/2017 B 0 0 0 0 1 1 0 0 1 6.5 
01/03/2017 A 0 1 0 0 0 0 0 0 0 7.8 
01/04/2017 C 0 0 1 0 0 1 0 0 0 6.5 
01/04/2017 C 0 0 0 0 0 0 1 0 0 7.3 

私は:

のほかに、私のデータは、設定した時間の流れが、私は同じ日に起こって複数の差事件を持っているとき、私は、この場合、第1差分法を適用する方法を確認していないこれは以下のようですこれは、再び、次のようになる日やIDに応じて:

以外にも
Date ID X Y Z L M A B C D E 
01/01/2017 A 0 1 0 0 0 0 1 0 0 7.8 
01/01/2017 A 0 1 0 0 0 1 0 0 1 6.5 
01/01/2017 B 0 0 0 0 1 1 0 0 1 6.5 
01/03/2017 A 0 1 0 0 0 0 0 0 0 7.8 
01/04/2017 C 0 0 1 0 0 1 0 0 0 6.5 
01/04/2017 C 0 0 0 0 0 0 1 0 0 7.3 

、私のパネル回帰に使用しても、この利用この行列の上に第1の差分を取るために[OK]を並べ替え、この新しいデータですか?

+0

私は技術的には、-1,0、または1を得られないのですか? – Dason

+0

はい、バイナリ変数として-1ですか? – Eric

答えて

1

退行者は、時間不変であっても時変であってもよい。いくつかの推定量、特に内部と第1の差の推定値については、時変リグレッサの係数のみが同定されている(Cameron and Triverdi、Microeconometric Methods and Applications)。あなたの退行者の中には時間不変のものがあるようです。

あなたは時系列データを扱うのではなく、パネルデータまたは縦データを扱います。もちろん、あなたはIDと日付を繰り返しています。つまり、Arellano-BondやBlundell-Bondのようなパネルデータツールとの自己相関を扱う必要があります。 R plmパッケージのpgmmまたはStataのxtdpdsysまたはxtabondを参照してください。

パネルIDを識別する変数が複数ある場合は、R create ID within a groupを使用して統合することができます。 Stataで作業している場合は、 egen id = group(sub_id_1 sub_id_2)とすることができます。

+0

ありがとうございます。私は現在、インデックス= c( "年"、 "ID")でPLM関数を使用しています。 IDにしたがってデータをソートした後、時間に応じてソートし、すべての行の最初の違いを取ると、これはまだOKですか? IDと日付の並べ替えがあります。 – Eric

+0

lm関数を使用している場合を除き、あなたは自分で差分をとるべきではありません。より適切なアプローチは、PLM呼び出しでモデル変数を指定することです: 'plm(...、model =" fd ")'。 –

+0

私は私の公式の上でdwtestをすると、私は自己相関の問題が発生するので、私は願っています。だから私は最初の違いの方法を生データよりも先に使って新しい生データとして使用しました。だから、最初の年と最初のIDを生データから削除して、総データ数と一致させます。私はこれをまた "fd"するかもしれませんが、自己相関の問題を持たない私にとっては第一の優先事項なので重要ではありません。また、私の生データの配列は大丈夫ですか? – Eric

関連する問題