パネルデータセット内の個体が観察された年を特定し、その情報を別の変数に登録したいと考えています。 個体は、より連続した年に亘って観察され得るか、または1年以上の間隙があり、その後連続した毎年の観察が続いてもよい。個人が観察されたすべての年の登録Rのパネルデータセット:
ID 2は、2000および2002で観察しながら、例えば、2001年
DF = data.table(年の間隔で、2000年および2001年に観察される以下DFでID 1
df(1)ここで、d(t)= c(2000,2000,2001,2002,2002)、ID = c(1,2,3,3,2,3)
年| ID | V1
2000 | 1 |
2000 | 2 |
2001 | 1 |
2001 | 3 |
2002 | 2 |
2002 | 3 | |
年:
私はその後、V1にoutpout望んIDごとに観測年のチェーンが含まれていますID | V1
2000 | 1 | 00/01
2000 | 2 | 00/02
2001 | 1 | 00/01
2001 | 3 | 01/02
2002 | 2 | 00/02
2002 | 3 | 01/02
それ以上の情報は、IDの個々の観測値ごとに重要ではないため、各IDの最初の観測についてのみ観測された年の情報です。
年| ID | V1
2000 | 1 | 00/01
2000 | 2 | 00/02
2001 | 1 |
2001 | 3 | 01/02
2002 | 2 |
2002 | 3 |
ありがとうございました!
あなたがこの情報を行うことを計画しているものは明らかではないが。将来の計算のためにおそらくより有用な解決策は、各IDの観測年を別々の名前付きリストに保存することです。これは 'split(df $ Year、df $ ID)'のようになります。 – lmo
私の考えは、各期間の頻度を簡単に見ることでした。つまり、テーブル(df $ V1)(上記の2番目の表のようにV1を使用)を使用して、V1の望ましい出力が得られたと仮定して、IDが観測された各期間の観測数を簡単に取得できます。これがV1の作成範囲です。 – Enrico
また、観察された期間に関してIDを区別するために、サブデータセットを容易に作成するために、それらが観察された時点または時点の情報を各IDに割り当てる。 – Enrico