2017-05-21 61 views
0

のタグは、<td>のタグ内にあるすべてのテキストを検索したいと思います。ここでBeautifulSoup、全子供のテキストを取得<a>タグ​​のタグ

は、HTMLソースコードの一部です。ここ

 <td style="overflow:hidden;"> 
      <a href="https://random.com"> 
       Hello, what's up...     </a> 
     </td> 

     <td style="overflow:hidden;"> 
      <a href="https://random2.com"> 
       Hola, como esta ?     </a> 
     </td> 

は、私が試したコードです:

soup = BeautifulSoup(html) 

for td_tag in soup.find_all('td'): 

    print td_tag.a.string 

しかし、私はエラーを取得する:

AttributeError: 'NoneType' object has no attribute 'string'

答えて

0

ページのtdに子要素がすべてaあるため、エラーが発生します。 a子要素がない場合、td_tag.aNoneになります。

用いることであろう要件に合うように、最も簡単な方法CSS selectortd atd親要素を持つすべてのaの要素にマッチする

for a in soup.select('td a'): 
    print(a.get_text()) 

td > aを使用して直接の親子関係チェックを行うこともできます。

関連する問題