2017-02-23 13 views
0

NBA選手のトリプルダブルゲームのデータを集め、平均で最も爆発的なデータを持つ人を探したいと思っています。tabstat:特定の変数で出力を並べ替え/並べ替える方法は?

ソースは「バスケットボールリファレンス - Playerゲームファインダー - トリプルダブルス」である。(理由は評判の不足の私は、直接URLを投稿することができないことを申し訳ありませんが)

だから私は(記述統計をまとめた表を生成例えば使用して、いくつかの変数(pts trb ast stl blk)のために)意味回数:

tabstat pts trb ast stl blk, statistics(count mean) format(%9.1f) by(player)

私は何を取得すると、次の表である。

tabstat RESU LT:

enter image description here

はどのようにして、その後ptsでテーブルをソートして取得するカラムとして(これまでに10以上のトリプルダブルスを得た)count >= 10で選手をフィルタリングするためのStataを伝えることができます。

に最適結果:上記のよう

enter image description here

、私はマイケル・ジョーダンとジェームス・ハーデンがトップ2で最も爆発的なトリプルダブルプレーヤーであると言うだろうとダレル・ウォーカーはtです彼は最も経済的な人です。

答えて

0

https://stackoverflow.com/help/mcveはすぐに作業できる他の人の例を提示する方法について学習してください。また、普遍的に理解できないスポーツ特有の専門用語を避け、一般的なプログラミング問題にもっと重点を置くと、助けになります。幸いにも、あなたが望むものはそれにもかかわらず明らかです。

これを行うには、tabstatコールの前に希望する順序を定義する変数を作成する必要があります。あなたが望むようにラベルを付けるには、labmasksearch labmask)をStata Journalからダウンロードしてください。

ここにいくつかの手法があります。

sysuse auto, clear 

egen mean = mean(weight), by(rep78) 
egen count = count(weight), by(rep78) 

egen group = group(mean rep78) if count >= 5 
replace group = -group 
labmask group, values(rep78) 
label var group "`: var label rep78'" 

tabstat mpg weight , by(group) s(count mean) format(%1.0f) 

Summary statistics: N, mean 
    by categories of: group (Repair Record 1978) 

group |  mpg weight 
-------+-------------------- 
    2 |   8   8 
     |  19  3354 
-------+-------------------- 
    3 |  30  30 
     |  19  3299 
-------+-------------------- 
    4 |  18  18 
     |  22  2870 
-------+-------------------- 
    5 |  11  11 
     |  27  2323 
-------+-------------------- 
Total |  67  67 
     |  21  3030 
---------------------------- 

キーの詳細:

  1. は、グループ化変数は、手段のつながりがあるだけの場合には、あなたがソートする手段にも、元のグループ化変数にだけではなく基づいています。

  2. 最高平均から下に向かって注文するには、グループ化変数を否定する必要があります。

  3. tabstat表の本文に可変ラベルは表示されません。 (通常は十分なスペースがありません)

関連する問題