2016-12-08 10 views
1

私はPandasとMLの新人です。私はの本を読んでいます。と思って練習をしてください。付随するコードは、NSFGサイクル6のデータを符号化のためのデータフレームとしてロードする。 練習の1つは、データフレーム内の利用可能な関数を使用して、「preglngth」と呼ばれるシリーズを表示するように指示します。次にNSFGのコードブックで結果をクロスチェックするように求めます。次のように私のコードは、Python、インデックス値の範囲でグループ化されたPandasシリーズを印刷するには

import nsfg 
df = nsfg.ReadFemPreg() 
df.prglngth.value_counts(sort=True) 

であり、私は次の出力を取得し、

 
+----------------+ 
| 39  4744 | 
| 40  1120 | 
| 38   609 | 
| 9   594 | 
| 41   591 | 
| 6   543 | 
| 37   457 | 
| 13   446 | 
| 4   412 | 
| 8   409 | 
| 35   357 | 
| 36   329 | 
+----------------+ 

のように...

名:prglngth、DTYPE:

int64モードのコードブックlinkは、次のように表示します。

Screenclip

上記のインデックス値の範囲に基づいてシリーズ値を表示したいとします。私は何をすべきか?おかげさまで

クリシュ。

答えて

0

pd.qcut()機能は、ビンの値に役立ちます。インデックス値をbinにしたいので、それらをgroupby関数に渡します。

s = df.prglngth.value_counts(sort=True) 
s.groupby(pd.cut(s.index, [0, 13.5, 26.5, 100])).sum() 
関連する問題