2017-05-13 14 views
2

class_="_e4d"class_="href"をスクラップしたいと思います。基本的には、BeautifulSoupを使ってクラス内のクラスをスクレイプすることを目指しています。クラス内のクラスを掻き集める

from bs4 import BeautifulSoup 
import selenium.webdriver as webdriver 

url = ("https://www.google.com/search?...") 

def get_related_search(url): 
    driver = webdriver.Chrome("C:\\Users\\John\\bin\\chromedriver.exe") 
    driver.get(url) 
    soup = BeautifulSoup(driver.page_source) 
    relate_result = soup.find_all("p", class_="_e4b") 
    return relate_result[0] 

relate_url = get_related_search(url) 
print(relate_url) 

結果:MARKUP_TYPE = MARKUP_TYPE)) Pクラス= "_ E4B"} {のhref = "/検索... A} {/ P}

私は今のhrefをこすりしたいですか?その結果、私は次のステップがどうなるかわからない助けてくれてありがとう

注:。。。私は<を置き換え> {}でそれがHTMLスクリプト

答えて

2

として表示されませんでしたので、あなたが実際にこれは内部見つけることができますa要素を1つにまとめてCSS selector

links = soup.select("p._e4b a[href]") 
for link in links: 
    print(link['href']) 

p._e4b a[href]_e4bクラスを持つp要素内部href属性を持つすべてのaの要素を見つけます。

+0

これは美しく機能しました。ありがとうございました! – Mwspencer

関連する問題