2017-11-21 1 views
0

20年のパネルデータセットがあり、複数の企業が異なる財務産出額(売上、費用など)を持っています。私には10万回以上の観測があります。パネルデータセット内の1つの変数のカウントとドロップの観察

データセットに2つ以下の観測値しか持たない企業を削除したいとします(たとえば、企業Aは2000年に出力しますが、他の年には出力しません)。

私が使用:

by fyear: tabulate companyid 

を私が3未満の観察と企業を見ることができますが、どのようにそれは自動的に以下の3つの観測とそれらのすべてをドロップすることは可能でしょうか?

答えて

1
by companyid (fyear), sort: drop if _N<3 

これは企業IDとfyearによって並べ替えられ、あなたの残りのデータを残しますので、あなたが本当にそれがfyearでソートしたい場合、あなたは

sort fyear companyid 
でこれを実行する必要があります
関連する問題