テーブルをウェブサイトから取り出し、それをテーブルではなくグラフに変換することは可能です(簡単な方法です)?グラフをテーブルに入れる(美しいPythonで)
ここでコードはテーブルをテーブルに抽出するコードです。
あなたはパンダreadhtml
機能を使用することができるウェブサイト
import urllib2
#specify the url
wiki = "https://en.wikipedia.org/wiki/List_of_state_and_union_territory_capitals_in_India"
#Query the website and return the html to the variable 'page'
page = urllib2.urlopen(wiki)
#import the Beautiful soup functions to parse the data returned from the website
from bs4 import BeautifulSoup
#Parse the html in the 'page' variable, and store it in Beautiful Soup format
soup = BeautifulSoup(page)
all_tables=soup.find_all('table')
right_table=soup.find('table', class_='wikitable sortable plainrowheaders')
right_table
#Generate lists
A=[]
B=[]
C=[]
D=[]
E=[]
F=[]
G=[]
for row in right_table.findAll("tr"):
cells = row.findAll('td')
states=row.findAll('th') #To store second column data
if len(cells)==6: #Only extract table body not heading
A.append(cells[0].find(text=True))
B.append(states[0].find(text=True))
C.append(cells[1].find(text=True))
D.append(cells[2].find(text=True))
E.append(cells[3].find(text=True))
F.append(cells[4].find(text=True))
G.append(cells[5].find(text=True))
#import pandas to convert list to data frame
import pandas as pd
df=pd.DataFrame(A,columns=['Number'])
df['State/UT']=B
df['Admin_Capital']=C
df['Legislative_Capital']=D
df['Judiciary_Capital']=E
df['Year_Capital']=F
df['Former_Capital']=G
df
?いくつかのプロットを意味しますか? pandasにはプロットする機能があります。ドキュメントをチェックしてください。 – furas
はい簡単なプロットです。 –
'df.plot()'? 'pandas'は' matplotlib'を使用していますので、 'matplotlib'のドキュメンテーションでもっと見つけることができます。 – furas