2016-11-20 18 views
1

私は画像に次のデータフレームを持っています。私は持っていますヒストグラムをプロットして、世界中のすべての国の分布を表示します(例えば2010年)。任意の年(例えば2010)のために、すべての国のヒストグラムをプロットするためにパンダのPythonでヒストグラムを作成する方法

dataSheet = pd.read_excel("http://api.worldbank.org/v2/en/indicator/EN.ATM.CO2E.PC?downloadformat=excel",sheetname="Data") 
dataSheet = dataSheet.transpose() 
dataSheet = dataSheet.drop(dataSheet.columns[[0,1]], axis=1) ; 
dataSheet = dataSheet.drop(['World Development Indicators', 'Unnamed: 2','Unnamed: 3']) 

enter image description here

答えて

1

、私はどうなる:後

は私のコード表は、クリーニングの次のコードの後に​​生成されます以下。あなたのコードの後:

dataSheet = pd.read_excel("http://api.worldbank.org/v2/en/indicator/EN.ATM.CO2E.PC? downloadformat=excel",sheetname="Data") 
dataSheet = dataSheet.transpose() 
dataSheet = dataSheet.drop(dataSheet.columns[[0,1]], axis=1) 
dataSheet = dataSheet.drop(['World Development Indicators', 'Unnamed: 2','Unnamed: 3']) 

私は、列名として実際の国名を割り当てることによって、列名を再編成します:

dataSheet.columns = dataSheet.iloc[1] # here I'm assigning the column names 
dataSheet = dataSheet.reindex(dataSheet.index.drop('Data Source')) # here I'm re-indexing and getting rid of the duplicate row 

をそれから私は、安全のために(再びデータフレームを転置でしょう私は

df = dataSheet.transpose() 

をそして、私は新しい列名を割り当てることで以前と同様に、私は同じことを行うと思いますので、私たちは国の名前などで)まだ最適ではないが、(まともなデータフレームを取得する:)新しい変数に代入私ndex。

df.columns = df.iloc[0] 
df = df.reindex(df.index.drop('Country Name')) 

Reorganised dataframe

今、あなたは最終的には、例えばのためのヒストグラムをプロットすることができます2010年:

import matplotlib.pyplot as plt 
df[2010].plot(kind='bar', figsize=[30,10]) 

Histogram of 2010

関連する問題