スナップショットに指定された特定のスパンのテキストを抽出します。クラスの属性でスパンを見つけることができません。私は抽出されるデータのhtmlソース(スナップショット)も添付しました。 提案がありますか?クラスごとにスパンを見つけてその内容を抽出する
import bs4 as bs
import urllib
sourceUrl='https://www.pakwheels.com/forums/t/planing-a-trip-from-karachi-to-lahore-by-road-in-feb-2017/414115/2'
source=urllib.request.urlopen(sourceUrl).read()
soup=bs.BeautifulSoup(source, 'html.parser')
count=soup.find('span',{'class':'number'})
print(len(count))
画像を参照してください:
はまだ多分あなたのコンテンツはJavaScriptを介して生成される –