2017-12-28 44 views
1

はのは、私は次の要素を持つHTMLページを持っているとしましょうURL?セレンスクリプト内でonclickイベントのターゲットURLを抽出

ありがとうございます。 Browser Instanceを開始ユーザーの対話を皮肉っSeleniumとして、それはget the target URL of the button without having the browser visit the URLSeleniumでは可能ではないでしょう見出しあなたの質問を1として

+0

それはあなたから不明です'Selenium'が' User Actions'を模倣しているので、 'ブラウザがURLを訪れることなく'ボタンのターゲットURLをどう取得するのか疑問です。おそらく、あなたは[BeautifulSoup](https://www.crummy.com/software/BeautifulSoup/bs4/doc/)を使用して検討しなければならない 'web-scraping'の観点を形作るでしょう。 – DebanjanB

+0

リンクはJavaScriptのやりとりの結果であるため、これには美しいものを使用しないでください。私ができることは、要素をクリックし、ドメインが変更された場合は前のURLに戻ることです...しかし、それは理想的ではありません。助けてくれてありがとう。 –

+0

さて、あなたは 'ブラウザを持たずに'セレン 'の方法ではないことを求めています。したがって、 'Beautifulsoup'は' Answer'です:) – DebanjanB

答えて

3

あなたはページのソースを抽出し、次のコードブロックごとにsplit()機能を使用することができますhttp://www.google.com/であるターゲットURLを取得するには、ブラウザを起動したら:

driver.get('https://www.your_url.co.in') 
page_source = driver.page_source 
text_part = page_source.split("window.location.href='") 
my_url = text_part[1].split("';") 
print(my_url[0])