ここに私の現在のコードがあります。私は何が間違っているのか分かりません。多分私はhtmlで十分深く掘り下げておらず、Beautifulsoupに正しいタグを与えているのでしょうか?現時点では、私のコードは空白を返しています。Beautifulsoup4とPython 3であなたの動画をスクラップする方法
from bs4 import BeautifulSoup
from urllib.request import urlopen
html = urlopen("https://www.youtube.com/watch?v=5_zrHZdhaBU")
soup = BeautifulSoup(html,'html.parser')
nameList = soup.findAll("div", {"id": "cp-2"})
for name in nameList:
print(name.get_text())
これは私が検査したコードです。
<div id="cp-2" class="caption-line" data-time="7.54"><div class="caption-line-time">0:07</div><div class="caption-line-text">but it was untucked.</div></div>
***編集
コードは次のシェアボタンに「もっと」をクリックすることで見つけることができる私は、Pythonが私に戻って戻るために取得しようとしている「が、それはuntuckedでした」。次に、トランスクリプトをクリックすると、そこにすべてのテキストが表示されます。
私はページとHTMLでこの行を見つけることができません。この行は何ですか? –
これはajax経由で動的に読み込まれていないのですか?オープンページソースは、静的ソースにそのような要素がないかもしれません。 –
@Yevhen Kuzmovych YouTubeのページに行くと、共有の隣に「もっと見る」ボタンがあります。それをクリックし、トランスクリプトをクリックします。それは0:07行です。 –