2017-06-29 5 views
1

のない私はエキス<tr>タグデータクラスやID

<tr class="TTRow"> 
     <td> 
     <a class="tablebluelink" href="" target="_blank">517330</a></td> 
     <td class="TTRow_left">CMI</td> 
     <td>29 Jun 2017</td> 
    </tr> 

美しいスープを使用してHTMLを次の中から日付を抽出しようとしている=私は、これは

r=urllib.urlopen('http://www.bseindia.com/corporates/Forth_Results.aspx?expandable=0').read() 
soup=BeautifulSoup(r) 
companies= soup.findAll("tr", class_= "TTRow") 
i=0 
for company in companies: 
    upcoming_company_results[i]=str(company.find("td",class_="TTRow_left").text) 
    date[i]=str(company.find("td").text) 
    i=i+1 

を働くだろうと思った。しかし、それはクラスでテキストを提供します日付の代わりに日付[i]の "tablbluelink"。 日付を抽出する方法 "2017年6月29日"をフォームにします。

+0

をこの回答を使用し、コンテンツを利用した://www.crummy。 com/software/BeautifulSoup/bs3/documentation.html#contents –

答えて

0

私は解決策を見つけたとコンテンツを利用した、あなたがどこかでこのような立ち往生している場合参照して、HTTPSより良い参考のためにPython BeautifulSoup extract text between element

for company in companies: 
    upcoming_company_results[i]=str(company.find("td",class_="TTRow_left").text) 
    date[i]= str(company.contents[3].text) 
    i=i+1