0
現在、私はこれを解析中ですurlです。 Urlは解析関数の引数になります。BeautifulSoup:タグ間の文字列の抽出が機能していないようです。
def parse(sitemap):
req = urllib.request.urlopen(sitemap)
soup = BeautifulSoup(req, 'lxml')
soup.prettify()
inventory_url = []
inventory_url_set = set()
for item in soup.find_all('url'):
print(item.find('lastmod'))
# print(item.find('lastmod').text)
inventory_url_set.add(item.find('loc').text)
しかし、item.find('lastmod').text
は、私はそれが正常に動作し、全タグitem.find('lastmod')
を印刷した場合のに対してはAttributeErrorをretuns。
「lastmod」タグの間のテキストは、各「item」内から取得したいと考えています。
おかげ