2017-12-09 12 views
0

属性とクラスの数、属性とクラスの説明、インスタンスとクラスの数についてのヒストグラムが必要ですが、これはプログラムの新機能ですがこれまでに試したことです。ヒストグラムプロットPython

import numpy as np 
import pandas as pd 
import matplotlib.mlab as mlab 
import matplotlib.pyplot as plt 

data=pd.read_csv('mushroom') 
column=df.'Class' 
num_bins = 5 
n, bins, patches = plt.hist(column, num_bins, facecolor='blue', alpha=0.5) 
plt.show() 

これは私のデータは

cap-shape,cap-surface,cap-color,bruises,odor,gill-attachment,gill-spacing,gill-size,gill-color,stalk-shape,stalk-surface-above-ring,stalk-surface-below-ring,stalk-color-above-ring,stalk-color-below-ring,veil-type,veil-color,ring-number,ring-type,spore-print-color,population,habitat,Class 
,f,g,f,n,f,c,n,p,e,s,s,w,w,p,w,o,p,k,v,u,p 
,f,g,f,n,f,c,n,n,e,s,s,w,w,p,w,o,p,k,y,u,p 
x,f,g,f,n,f,w,b,k,t,s,f,w,w,p,w,o,e,n,s,g,e 
,f,g,f,n,f,c,n,g,e,s,s,w,w,p,w,o,p,n,y,u,e 
x,f,w,f,n,f,w,b,p,t,f,s,w,w,p,w,o,e,n,a,g,e 
s,f,n,f,n,f,c,n,n,e,s,s,w,w,p,w,o,p,k,v,u,e 
f,f,n,f,n,f,c,n,n,e,s,s,w,w,p,w,o,p,n,v,u,e 
x,f,g,f,n,f,c,n,p,e,s,s,w,w,p,w,o,p,n,y,u,e 
f,s,g,f,n,f,w,b,n,t,s,f,w,w,p,w,o,e,n,s,g,e 
x,f,w,f,n,f,w,b,n,t,f,f,w,w,p,w,o,e,n,a,g,e 
x,s,n,f,n,f,w,b,p,t,f,f,w,w,p,w,o,e,k,s,g,e 
x,s,w,f,n,f,w,b,h,t,f,s,w,w,p,w,o,e,n,s,g,p 
f,f,w,f,n,f,w,b,p,t,f,s,w,w,p,w,o,e,k,s,g,p 
x,f,g,f,n,f,w,b,p,t,f,f,w,w,p,w,o,e,n,s,g,e 
+2

あなたの質問は何ですか? – Cleb

答えて

0

クラスどのように見えるかあるカテゴリ変数(または因子http://www.statisticshowto.com/what-is-a-categorical-variable/)です。ビニングとヒストグラムは、連続変数(http://www.statisticshowto.com/continuous-variable/)を持つときに意味があります。

あなたが実際に必要とするのは、頻度プロット、カテゴリデータの各結果の頻度を示す棒グラフです。

私の前提が正しい場合、次のコードは問題を解決します。

import pandas 
import matplotlib.pyplot as plt 

data = pandas.read_csv('mushroom.csv') 
fig, ax = plt.subplots() 
data['Class'].value_counts().plot(kind='bar', ax=ax) 
plt.show() 
関連する問題