私はウィキペディアのページからそれを掻き集めて特定の場所のエリアを取得しようとしています。例としてCumbriaを使用して(https://en.wikipedia.org/wiki/Cumbria)私は情報ボックスを得ることができます。テキストで美しいスープのアイテムを探すタグではない
url = 'https://en.wikipedia.org/wiki/Cumbria'
r = requests.get(url)
soup = BeautifulSoup(r.content, 'lxml')
value = soup.find('table', {"class": "infobox geography vcard"}) \
.find('tr', {"class":"mergedrow"}).text
しかしinfobox geography vcard
は複数<tr class='mergerow'>
サブセットを有し、各内<th scope='row'>
です。
私が欲しい<th scope='row'>
が<th scope="row">Area</th>
で、他のすべてはあなたがすることができinfobox geography vcard
find_next_siblingについては、わかりませんでした。非常に便利! –