私は、ウェブページから別のカテゴリー名を得るためにスクレーパーをPythonで書いていますが、そのページから何かを取り出すことはできません。私はどこが間違っているのか理解できないように真剣に混乱しています。どんな助けも大いに評価されるでしょう。ここでウェブページからカテゴリータイトルを削ることはできません
では、ウェブページへのリンクです:
<div class="slide_container">
<a href="/offers/furniture/" tabindex="0">
<picture style="float: left; width: 100%;"><img style="width:100%" src="/_m4/9/8/1513184943_4413.jpg" data-w="270"></picture>
<div class="floated-details inverted" style="height: 69px;">
<div class="h3 margin-top-sm margin-bottom-sm standardTitle">
Furniture Offers #This is the name I'm after
</div>
<p class="carouselDesc">
</p>
</div>
</a>
</div>
:1つのなどのカテゴリ名は、私が後だその中
from bs4 import BeautifulSoup
import requests
res = requests.get("replace_with_above_url",headers={"User-Agent":"Mozilla/5.0"})
soup = BeautifulSoup(res.text,"lxml")
for items in soup.select('.slide_container .h3.standardTitle'):
print(items.text)
要素を:ここでURL
は、私がこれまで試したものです
res.textに正しいhtmlが表示されますか? – imox
あなたはあなたがあなたのブラウザで実際に見ているページではなく、次のコンテンツをブロックするページを返します。 "www.therrange.coを閲覧中でした。あなたのブラウザについての何かが、あなたがボットだと思うようにしました。これにはいくつかの理由があります... " – Andersson
セレンを試しましたが、最後の結果は@sir Anderssonの言葉通りです。 – SIM