2017-02-20 27 views
0

動画をスクラップしたかったのですが、beautifulsoupはiframeが読み込まれるのを待っていません。私はセレンを使ってみましたが、Google webdriverはページ全体が読み込まれるまで待っています。私はまた、ページの読み込みが完了した後に、ページソースを取得できませんでした。beautifulsoupを使用してiframeをスクラップしようとしました

enter image description here

ことが良いでしょうか:

これは私がbeautifulsoupてみましたが、私はそうiframe内に、ここでビデオのリンクを取得しようとしたもの

def get_vidCode_from_source(source_url): 
    source_code = requests.get(source_url) 
    plain_text = source_code.text 
    soup = BeautifulSoup(plain_text,"html.parser") 
    print(soup.find('iframe')) 

get_vidCode_from_source('http://anilinkz.io/one-piece-episode-769?src=3') 

を取得していない私のコードでしたセレン以外のiframeを取得することはできますか?

+0

を使用すると、抽出するために、正確に何をしようとしていますか? iframeへのリンクまたは動画へのリンクですか?あなたの関数の名前の音によって、おそらくビデオに関連するコードですか? – serk

+0

はい、私はビデオリンクを取得したいと思います。しかし、iframe要素のコード全体が得られれば良いでしょう。 – user5389574

答えて

0

私はこれは少し古いです知っているが、このコードは、セレンを使用して、ページのソースの使用を得るために:

from selenium import webdriver 
browser = webdriver.Chrome() 
browser.get('http://anilinkz.io/one-piece-episode-769?src=3') 
soup = BeautifulSoup(browser.page_source, "lxml") 
browser.close() 
for x in soup.find_all('iframe'): 
    print(x) 
関連する問題