以下のページから読者のコメントを抽出しようとしています。しかし、出力html test.htmlには、このページのコメントは含まれていません。この情報をPythonでどのように入手できますか?Python urllibはウェブサイトから読者のコメントを抽出していません
from bs4 import BeautifulSoup
import urllib
import urllib.request
import urllib.parse
req =urllib.request.Request('http://www.theglobeandmail.com/opinion/it-doesnt-matter-who-won-the-debate-america-has-already-lost/article32314064/comments/')
response = urllib.request.urlopen(req)
the_page = response.read()
soup = BeautifulSoup(the_page, 'html.parser')
f = open('test.html', 'w')
f.write(soup.prettify())
f.close()
ありがとう!
コメントはjsで取得される可能性が最も高いです。ブラウザー+ jsランタイム(pahtomjsなど)を組み込んだスクレイピングライブラリーを使用するか、コメント内のAPIが何であるかを把握して、それを直接使用することができます。 – pvg