変数があります。多くの欠損値を持つ変数var
は、95パーセンタイルを計算したい場合、この値を使用して95パーセンタイルを超える観測値を削除します変数を逃していない観測)。Stata:egen rowpctile単一パーセンタイル値の代わりに値の範囲
多くの欠損値のため、私はegen
とrowpctile
を使用します。これは、欠損値を無視して、p(#)
パーセンタイルを計算することになっています。
. egen p95 = rowpctile(var), p(95)
. list p95
+-----------+
| p95 |
|-----------|
1. | . |
2. | 65.71429 |
3. | 14.28571 |
4. | . |
5. | . |
...
は私が間違って機能を使用していますか、行くには良い方法があります:私は、P95の値を見てみると下図のように、しかし、彼らはむしろ、単一の95パーセンタイル値とは異なる値の範囲ですこれについて? egen
コマンドの
rowpctile
通常、上位5%を投げるよりもデータを分析する方が良い方法があります。 –
合意@NickCox。しかし、これは課題のためのものですので、私は要求通りに行う必要がありますが、より正確なアウトライヤーの特定方法についての展示を予定しています。 – kathystehl