クラス内のクラスを掻き集める

class_="_e4d"でclass_="href"をスクラップしたいと思います。基本的には、BeautifulSoupを使ってクラス内のクラスをスクレイプすることを目指しています。クラス内のクラスを掻き集める

from bs4 import BeautifulSoup 
import selenium.webdriver as webdriver 

url = ("https://www.google.com/search?...") 

def get_related_search(url): 
    driver = webdriver.Chrome("C:\\Users\\John\\bin\\chromedriver.exe") 
    driver.get(url) 
    soup = BeautifulSoup(driver.page_source) 
    relate_result = soup.find_all("p", class_="_e4b") 
    return relate_result[0] 

relate_url = get_related_search(url) 
print(relate_url)

結果：MARKUP_TYPE = MARKUP_TYPE）） Pクラス= "_ E4B"} {のhref = "/検索... A} {/ P}

私は今のhrefをこすりしたいですか？その結果、私は次のステップがどうなるかわからない助けてくれてありがとう

注：。。。私は<を置き換え> {}でそれがHTMLスクリプト

出典

2017-05-13 Mwspencer

として表示されませんでしたので、あなたが実際にこれは内部見つけることができますa要素を1つにまとめてCSS selector ：

links = soup.select("p._e4b a[href]") 
for link in links: 
    print(link['href'])

p._e4b a[href]は_e4bクラスを持つp要素内部href属性を持つすべてのaの要素を見つけます。

出典

2017-05-13 22:01:17 alecxe

これは美しく機能しました。ありがとうございました！ – Mwspencer

クラス内のクラスを掻き集める

答えて

関連する問題