2016-08-18 8 views
1

私は変更ビンサイズ

'select action_count, count(*) "num_users" from customers group by action_count;' 

のようなSQL文からのデータを持っているとパンダのデータフレームにこれをロードします。私はデータ上で簡単なプロットコマンドを実行することができます、またはbarplotヒストグラムのように見えるようにします。しかし、このデータセットのビンサイズを簡単に変更するにはどうすればよいですか?そして、ビン、つまりx軸を正しくプロットするにはどうしたらいいですか?

ありがとうございます!

答えて

0

ビンのエッジの位置を指定するには、リストをpandashistで指定します。例えば、-0.5から-2.00.1数ずつ続い0.0に次いで-0.5から

import numpy as np 
import pandas as pd 
import matplotlib.pyplot as plt 

df =pd.DataFrame({'col1':np.random.randn(10000)}) 
df.hist(bins=[-2.,-0.5,0.,0.1,0.2,0.3]) 
plt.show() 

たプロット、

enter image description here

+0

うんをビンにカスタムシーケンスを使用して、これは正常です私が知っている通り。しかし、私が持っているデータは、もはや生データではありません(SQL文を見てください)。あなたの例の '[((-2、 - 。5)、2700)、((-.5,0)、1900)、...]のように書くのと同じです。ちょうど私は「ビン」として整数だけを持っています。 – asPlankBridge

+0

ヒストグラムデータ(例えば、 'numpy.histogram'の出力のようなもの)は既にありますか?プロットされたバーの幅をこれらの値と一致させたいでしょうか(この場合、上記のように配列にバーを入れるために 'width'引数を使うことができます)。あるいは、あなたが持っているデータ(補間の何らかの形式)とは異なる幅を得る必要がありますか?いくつかのサンプルデータと、出力のスケッチを含めることができますか? –

関連する問題