2013-09-23 23 views

答えて

21

ループと内部セルのテキスト(tdタグ)を得る:

for tr in soup.find_all('tr')[2:]: 
    tds = tr.find_all('td') 
    print "Nome: %s, Cognome: %s, Email: %s" % \ 
      (tds[0].text, tds[1].text, tds[2].text) 

プリント:

Nome:  Massimo, Cognome:  Allegri, Email:  [email protected] 
Nome:  Alessandra, Cognome:  Anastasia, Email:  [email protected] 
... 

FYI、ここで[2:]スライスは、2つのヘッダーをスキップします行。

UPDは、ここにあなたがtxtファイルに結果を保存することができます方法は次のとおりです。

with open('output.txt', 'w') as f: 
    for tr in soup.find_all('tr')[2:]: 
     tds = tr.find_all('td') 
     f.write("Nome: %s, Cognome: %s, Email: %s\n" % \ 
       (tds[0].text, tds[1].text, tds[2].text)) 
+0

あなたが必要とする理由を明確にすることができます:あなたの最初の行で、[2]を? – AZhao

+0

@AZhao確かに、それは答えにあります - 2つのヘッダー行をスキップします。 – alecxe