私は非常に新しいpythonリクエストと美しいスープですので、私のコードはおそらく本当に悪いです。私はパースしていますPython、リクエスト、および美しいスープを使用してキーワードに関連付けられたリンクを見つける方法
f = open('sites.txt','r')
sitelist = []
for line in f:
sitelist.append(line.strip())
getsites = ['']
print(sitelist)
for i in range(len(sitelist)):
getsites.append(sitelist[i])
for i in range(len(sitelist)):
temp = requests.get(sitelist[i])
data = temp.text
soup = BeautifulSoup(data, "html.parser")
for url in soup.find_all("Yeezy"):
print(element.find_previous_sibling('loc'))
print(url.text)
XMLファイルの例:私は今持っている
<url>
<loc>
https://www.a-ma-maniere.com/products/beanie-502805f16-black-white
</loc>
<lastmod>2016-12-24T22:25:05Z</lastmod>
<changefreq>daily</changefreq>
<image:image>
<image:loc>
https://cdn.shopify.com/s/files/1/0626/9065/products/502805F16-1.jpg?v=1472499019
</image:loc>
<image:title>Alexander Wang: Beanie (Black/White)</image:title>
</image:image>
</url>
を私がやりたいことは、それに関連付けられたリンクが格納されている印刷経由でキーワードをつかむです。
あなたが探しているキーワードのサンプルは何ですか?どのXMLフィールドがキーワードに最も適していると思われますか(つまり、キーワードのXMLはどこにありますか) – blacksite
キーワードはタグに表示されます。たとえば、このxmlでは "Alexander Wang"を検索し、対応する製品の場所を検索しようとしていますタグ –
cjlatch125