したがって、BeautifulSoup 4.0を使用してMichigan Department of Health and Human Services websiteのテーブルからデータをスクラップしようとしていますが、正しくフォーマットする方法がわかりません。テーブルヘッダーとデータをPython 2.7の美しいスープで抽出して印刷する
私は以下のコードをウェブサイトから取得するために書かれていますが、印刷や保存時にウェブサイトの表と同じ外観になるようにフォーマットする方法は紛失しています.txt/.csvファイルとして保存します。私はここで、そして他のウェブサイトで答えを探しましたが、これをどうやって進めるのか分かりません。私は非常に初心者ですので、どんな助けも高く評価されます。
私のコードだけで、テーブルの行やテーブルデータのいずれかの長いリストを出力します。
import urllib2
import bs4
from bs4 import BeautifulSoup
url = "https://www.mdch.state.mi.us/osr/natality/BirthsTrends.asp"
page = urllib2.urlopen(url)
soup = BeautifulSoup((page), "html.parser")
table = soup.find("table")
rows = table.find_all("tr")
for tr in rows:
tds = tr.find_all('td')
print tds
私が探していたHTMLが同様に下回っている
:
<table border=0 cellpadding=3 cellspacing=0 width=640 align="center">
<thead style="display: table-header-group;">
<tr height=18 align="center">
<th height=35 align="left" colspan="2">County</th>
<th height="35" align="right">
2005
</th>
その部分ショー2015年までは州と郡のデータはさらに下にあります:
<tr height="40" >
<th class="LeftAligned" colspan="2">Michigan</th>
<td>
127,518
</td>
残りの郡でも同様です。 もう一度、どんな助けも大歓迎です。
多次元配列(行→列)を作成するだけでOKです。 –
ここで私の無知を許してください。しかし、コードがある限り、それをどうやってやるのですか? – meddhead