beautifulsoupを使用してiframeをスクラップしようとしました

動画をスクラップしたかったのですが、beautifulsoupはiframeが読み込まれるのを待っていません。私はセレンを使ってみましたが、Google webdriverはページ全体が読み込まれるまで待っています。私はまた、ページの読み込みが完了した後に、ページソースを取得できませんでした。beautifulsoupを使用してiframeをスクラップしようとしました

ことが良いでしょうか：

これは私がbeautifulsoupてみましたが、私はそうiframe内に、ここでビデオのリンクを取得しようとしたもの

def get_vidCode_from_source(source_url): 
    source_code = requests.get(source_url) 
    plain_text = source_code.text 
    soup = BeautifulSoup(plain_text,"html.parser") 
    print(soup.find('iframe')) 

get_vidCode_from_source('http://anilinkz.io/one-piece-episode-769?src=3')

を取得していない私のコードでしたセレン以外のiframeを取得することはできますか？

出典

2017-02-20 user5389574

を使用すると、抽出するために、正確に何をしようとしていますか？ iframeへのリンクまたは動画へのリンクですか？あなたの関数の名前の音によって、おそらくビデオに関連するコードですか？ – serk

はい、私はビデオリンクを取得したいと思います。しかし、iframe要素のコード全体が得られれば良いでしょう。 – user5389574

私はこれは少し古いです知っているが、このコードは、セレンを使用して、ページのソースの使用を得るために：

from selenium import webdriver 
browser = webdriver.Chrome() 
browser.get('http://anilinkz.io/one-piece-episode-769?src=3') 
soup = BeautifulSoup(browser.page_source, "lxml") 
browser.close() 
for x in soup.find_all('iframe'): 
    print(x)

出典

2017-07-24 22:30:28 Mohamed

beautifulsoupを使用してiframeをスクラップしようとしました

答えて

関連する問題