私は特定の位置の特定のリンクから開始し、その後そのリンクを特定の回数だけ続けなければならないPythonクラスのこの割り当てを持っています。たぶん最初のリンクは、位置1 を持っている。これは、リンクです:http://python-data.dr-chuck.net/known_by_Fikret.htmlBeautifulsoupを使用したPython割り当てのリンクに続いて
traceback error picture 私はリンクを見つけるに問題があると、エラー「範囲外のインデックスは、」出てきます。誰もリンク/位置を見つける方法を理解するのに役立つことができますか?
import urllib
from BeautifulSoup import *
url = raw_input('Enter - ')
html = urllib.urlopen(url).read()
soup = BeautifulSoup(html)
count = int(raw_input('Enter count: '))+1
position = int(raw_input('Enter position: '))
tags = soup('a')
tags_lst = list()
for tag in tags:
needed_tag = tag.get('href', None)
tags_lst.append(needed_tag)
for i in range(0,count):
print 'retrieving: ',tags_lst[position]
OK、私はこのコードを書き、それが一種の作品:これは私のコードです
import urllib
from BeautifulSoup import *
url = raw_input('Enter - ')
html = urllib.urlopen(url).read()
soup = BeautifulSoup(html)
count = int(raw_input('Enter count: '))+1
position = int(raw_input('Enter position: '))
tags = soup('a')
tags_lst = list()
for tag in tags:
needed_tag = tag.get('href', None)
tags_lst.append(needed_tag)
for i in range(0,count):
print 'retrieving: ',tags_lst[position]
position = position + 1
私はまだ私はリスト全体を印刷しかし例のもの以外のリンクを取得しています
私は知らないので、位置が一致するリンクの。非常に奇妙な。
完全にあなたのトレースバックを表示し、可能な場合は、URLは何ですか?それは公開ですか? –
私はbsを間違ってインポートしている説明 – mthe25
を更新しました。 'bs4 import BeautifulSoup'から。カウント数はどういう意味ですか?と位置。あなたはポジションから次のカウントリンクを取ると言っていますか? –