2017-09-07 21 views
1

私は、YouTubeのビデオが公開された日付を保存する必要があるプロジェクトをやっています。
問題は、私はHTMLソースコードWebをPython 3で掻き集める

の途中で、このデータを検索しようといくつかの困難を抱えている。ここに私のコードの試みだということです。

import requests 
from bs4 import BeautifulSoup as BS 

url = "https://www.youtube.com/watch?v=XQgXKtPSzUI&t=915s" 
response = requests.get(url) 
soup = BS(response.content, "html.parser") 
response.close() 

dia = soup.find_all('span',{'class':'date'}) 
print(dia) 

が出力:

[] 

は、私が.find_all()に送る議論が間違っていることを知っています。
私はタイトルとビューのような同じコードを使ってビデオから他の情報を保存することができたので、これを言っています。
.find_all()を使用しているときに異なる引数を試しましたが、見つけられませんでした。

+0

YouTube APIを試しましたか? – SLaks

+0

私はしませんでした。どのようだ?私はあまりにもPythonの新機能です... –

+1

サンプルHTMLはありません。それを掘り下げてfind_all呼び出しが実際にhtmlと一致することを確認することができます。これは実際にはここでの唯一の答えです。そうでなければ、1つのシナリオに特有のコードを書いています。 –

答えて

0

YouTubeはjavascriptを使用して日付を追加しているため、情報はソースコードには含まれていないようです。あなたはソースコードに直接入っているので、Seleniumを使用してスクレープしたり、jsから日付を取得したりしてください。

+0

ありがとう、私はこれを試してみます –