2017-04-01 13 views
0

のために、私は次のようになり、データフレームがあります。ビンは、ヒストグラム

 legal value 
0 1  3 
1 1  7 
2 0  10 
3 1  12 
4 1  4 
5 1  17 
6 0  21 
7 1  19 
8 1  3 
9 0  18 
10 1  17 
11 1  17 
12 0  11 
13 1  23 

を、私は、ヒストグラムのための6つのビン間隔にのみ法的値を分割しようとしています。私はCX軸上のビン間隔のヒストグラムを作成しようとしている、との周波数い

bin frequency values 
0-6 3   3, 4, 3 
6-9 1   7 
9-12 1   12 
12-16 1   12 
16-20 4   17, 17, 19, 17 
20-24 1   23 

:収集したデータは次のようになり

[0-6], [6-9], [9-12], [12-16], [16-20], [20-24] 

:間隔は次のようになり有効の値がy軸にあります。基本的にこのようなヒストグラムを作成しようとしています。example

は、これまでのところ、私はこれを書いている:

グループに辞書とのビンをしようとしている
import pandas as pd 
import numpy as np 
import matplotlib.pyplot as plt 
from collections import defaultdict 

bins = ['0-6', '6-9', '9-12', '12-16', '16-20', '20-24'] 
df = pd.read_csv('data.csv', encoding = 'ISO-8859-1') 

d = defaultdict(int) 
for legal, value in zip(df['legal'], df['value']): 
    if (legal == 1): 
     if (0 <= value <= 6): 
      d[bins[0]] += 1 

が、これは複雑な上思えるとpandasライブラリを使用してより良い方法自分でなければなりません。

pandas.Dataframe.groupbyのようなものを使用してビンをそれぞれの頻度でグループ化し、これらの値をヒストグラムにプロットするには、matplotlib.pyplotを使用しますか?

答えて

1

グループ化を行う必要はなく、データフレームは「正当な」列の値でフィルタリングできます。

import matplotlib.pyplot as plt 
import pandas as pd 

legal= [1,1,0,1,1,1,0,1,1,0,1,1,0,1] 
value = [3,7,10,12,4,17,21,19,3,18,17,17,11,23] 
df = pd.DataFrame({"legal":legal, "value":value}) 

df2 = df[df["legal"] == 1] 

bins = [0,6,9,12,16,20,24] 
plt.hist(df2["value"], bins=bins, edgecolor="k") 
plt.xticks(bins) 

plt.show() 

enter image description here

関連する問題