私はbeautifulsoupを使用しています。imはタグ( 'a')でURLを取得しています。beautifulsoupで特定の行を取得し、再びループに挿入します
私の問題は、特定の行を取得する方法がわかりません。
私はユーザにある行position
と何回ループを実行させるべきかを入力させましたcountrepeat
。これはコードで実装されます。私は(例えば、3日用)position
行を取得するにはどうすればよい
- :
だから私は二つのことを把握傾けます。
- リンク
私のコードイムが使用していることを以下のように、どのように私は再びループにそのURLを実装してください:
import urllib.request, urllib.parse, urllib.error
from bs4 import BeautifulSoup
import ssl
# Ignore SSL certificate errors
ctx = ssl.create_default_context()
ctx.check_hostname = False
ctx.verify_mode = ssl.CERT_NONE
url = input('Enter - ')
countrepeat = int(input("Enter repeat number:"))
position = int(input("Enter start position:"))
for i in range(countrepeat):
html = urllib.request.urlopen(url, context=ctx).read()
soup = BeautifulSoup(html, 'html.parser')
tags = soup('a')
print(tags.get('href'))
url = tags.get('href')
明確にしてください:あなたはスープの中で「位置」のhrefを取得しようとしていますか?あなたはそれがループの各反復のために 'url'を要求することを望みますか? – Galen
はい、スープの位置hrefですが、最初にURLを尋ねるだけです。次に、hrefで見つかったリンクを自動的にたどるはずです。 私はurl = tags.get( 'href')を下に置いているので、変数urlで見つかったURLを置くと思いました。 – Erfan
私はスープの位置hrefを次のように実装しようとしました:tags = soup( 'a'、[position])しかし、それは機能しません、私はトレースバックを取得します。 (countrepeat)の範囲内のiについて : – Erfan