2017-05-18 27 views
2

からURLを取得する:は、どのように私はこのウェブサイトからすべてのURLを取得しようとしたウェブサイト

https://www.bbvavivienda.com/es/buscador/venta/vivienda/todos/la-coruna/

内部https://www.bbvavivienda.com/es/unidades/UV_n_UV00121705のようなリンクがたくさんありますが、私はセレンでそれらを回復することはできませんよ。どのようにそれを行うにはどのようなアイデア?

私がどのように試したかについての情報を追加します。明らかに...私は事前に...などのpython、セレン、と感謝を始めている:

**from selenium import webdriver 
from selenium.webdriver.common.keys import Keys 
driver = webdriver.Chrome("D:\Python27\selenium\webdriver\chrome\chromedriver.exe") 
driver.implicitly_wait(30) 
driver.maximize_window() 

driver.get("https://www.bbvavivienda.com/es/buscador/venta/vivienda/todos/la-coruna/") 
urls=driver.find_element_by_css_selector('a').get_attribute('href') 
print urls 

links = driver.find_elements_by_partial_link_text('_self') 
for link in links: 
    print link.get_attribute("href") 
driver.quit()** 
+2

*「どうやって?」正確には? [mcve]を与える。 – jonrsharpe

+0

私はどのように試したかについての情報を追加します。明らかに...私は、Python、セレンなどから始めています...あなたの助けに感謝Jonrsharpe私の質問 – FdMon

答えて

1

次のコードが有効です。リンクに間違った識別子を使用しています。

driver = webdriver.Chrome() 
driver.implicitly_wait(30) 
driver.maximize_window() 

    driver.get("https://www.bbvavivienda.com/es/buscador/venta/vivienda/todos/la-coruna/") 
    urls=driver.find_element_by_css_selector('a').get_attribute('href') 
    print urls 

    for link in driver.find_elements_by_xpath("//a[@target='_self']"): 
     try: 
      print link.get_attribute("href") 
     except Exception: 
      pass 
    driver.quit() 
+0

Gaurangに感謝、それはうまく動作します! – FdMon

-1

私のpythonを知らないが、通常はJavaで私たちのように、タグを持つWebページ内のすべての要素を見つけることができますウェブページ内のリンクを見つけるための "a"。以下のコードスニペットが役に立ちます。

List<WebElement> links = driver.findElements(By.tagName("a")); 

     System.out.println(links.size()); 

     for (int i = 1; i<=links.size(); i=i+1) 

     { 

      System.out.println(links.get(i).getText()); 

     } 
+0

pythonの問題のJavaソリューションですか? –

関連する問題