2017-04-20 12 views
1

私はHTMLのテーブルを見つけることができます解析HTMLテーブル

http://www.baseball-reference.com/teams/NYM/2017.shtml 

から「チームバッティング」テーブルを解析する:

table = soup.find('div', attrs={'class': 'overthrow table_container'}) 
table_body = table.find('tbody') 

そして、私は、データを見つけることができます

table_text=[] 
for tr in table_body.findAll('tr'): 
    tds = tr.findAll('td') 
    for td in tds: 
     table_text.append(td.get_text()) 

このテーブルをパンダで再作成するにはどうすればよいですか?私は辞書を作成することを考えていましたが、このデータからどのようにするのか分かりません。このhtmlテーブルをスクラップして表示するにはどうすればよいですか?

+0

パンダ[pd.read_html](http://pandas.pydata.org/pandas-docs/stable/generated/pandasを持っています。データフレームを出力するread_html.html#pandas-read-html)メソッド –

答えて

1

あなたはmatch引数を使用してテーブルを指すことができるpandas.read_html()を探しています。最初の1を取得し、それはDataFramesのリストを返すことに注意してください:

import pandas as pd 

url = "http://www.baseball-reference.com/teams/NYM/2017.shtml" 
dfs = pd.read_html(url, match="Team Batting") 
print(dfs[0])