は関係なく、属性の属性値で見つけるBeautifulSoup

は、私がこのような何かを持っていると言います。は関係なく、属性の属性値で見つけるBeautifulSoup

2017-03-06 viviwill

すべてを見つけるには、lambdaを使用して、特定の属性値を検索するか、クラスに必要な値が含まれているかどうかを調べます。

from bs4 import BeautifulSoup 

example = """<div class="cake">1</div> 
<h2 id="cake">1</div> 
<sometag someattribute="cake">1</div>""" 

soup = BeautifulSoup(example, "html.parser") 

print (soup.find_all(lambda tag: [a for a in tag.attrs.values() if a == "cake" or "cake" in tag.get("class")]))

出力：

[<div class="cake">1</div>, <h2 id="cake">1</h2>, <sometag someattribute="cake">1</sometag>]

出典

2017-03-06 11:18:28 Zroq

あなたが一緒に正規表現とBeautifulSoupを使用することができます。

r = '''<div class="cake">1</div> 
<h2 id="cake">1</div> 
<sometag someattribute="cake">1</div>''' 

import re 
from bs4 import BeautifulSoup 
soup = BeautifulSoup(r, 'lxml') 

for i in range(len(re.findall(r'(\w+)="cake"',str(soup)))-1): 
    print(soup.find_all(re.compile(r'(\w+)'), {(re.findall(pattern,str(soup)))[i]:'cake'}))

出力：これは私のひどいスクリプトです

[<div class="cake">1</div>] 
[<h2 id="cake">1 </div> 
<sometag someattribute="cake">1</sometag></h2>]

出典

2017-03-07 12:48:18

は関係なく、属性の属性値で見つけるBeautifulSoup

答えて

関連する問題