16
BeautifulSoupでテーブルスクレイプを作成しようとしています。私はこのPythonコードを書きました:Python BeautifulSoupスクラップテーブル
私はNome、Cognome、Emailをこすります。表の行(tr
タグ)上
BeautifulSoupでテーブルスクレイプを作成しようとしています。私はこのPythonコードを書きました:Python BeautifulSoupスクラップテーブル
私はNome、Cognome、Emailをこすります。表の行(tr
タグ)上
ループと内部セルのテキスト(td
タグ)を得る:
for tr in soup.find_all('tr')[2:]:
tds = tr.find_all('td')
print "Nome: %s, Cognome: %s, Email: %s" % \
(tds[0].text, tds[1].text, tds[2].text)
プリント:
Nome: Massimo, Cognome: Allegri, Email: [email protected]
Nome: Alessandra, Cognome: Anastasia, Email: [email protected]
...
FYI、ここで[2:]
スライスは、2つのヘッダーをスキップします行。
UPDは、ここにあなたがtxtファイルに結果を保存することができます方法は次のとおりです。
with open('output.txt', 'w') as f:
for tr in soup.find_all('tr')[2:]:
tds = tr.find_all('td')
f.write("Nome: %s, Cognome: %s, Email: %s\n" % \
(tds[0].text, tds[1].text, tds[2].text))
あなたが必要とする理由を明確にすることができます:あなたの最初の行で、[2]を? – AZhao
@AZhao確かに、それは答えにあります - 2つのヘッダー行をスキップします。 – alecxe