私はパイソンでスクレーパーを作った。スムーズに走っています。今、私はそのページからの特定のリンクを破棄したり受け入れたりしたいと思います。リンクは「携帯」のみを含んでいますが、条件文を作成してもそれを行うことはできません。私の間違いを是正する助けを得ることを願っています。条件文を使ってウェブページから特定のアイテムを選ぶ方法
import requests
from bs4 import BeautifulSoup
def SpecificItem():
url = 'https://www.flipkart.com/'
Process = requests.get(url)
soup = BeautifulSoup(Process.text, "lxml")
for link in soup.findAll('div',class_='')[0].findAll('a'):
if "mobiles" not in link:
print(link.get('href'))
SpecificItem()
一方、xpathでlxmlライブラリを使用して同じことを行うと、動作します。
import requests
from lxml import html
def SpecificItem():
url = 'https://www.flipkart.com/'
Process = requests.get(url)
tree = html.fromstring(Process.text)
links = tree.xpath('//div[@class=""]//a/@href')
for link in links:
if "mobiles" not in link:
print(link)
SpecificItem()
だから、この時点では、私はBeautifulSoupライブラリではコードが目的を達成するために多少異なるはずだと思います。
条件文を削除してすべてを印刷します。あなたは何を見ますか? –
お返事ありがとうございました。私は条件文を削除すると、私はそのページで利用可能なすべてのリンクを見ることができます。実際、if文とif文を使用しないと、結果に変更は見られません。 – SIM