0
私はPythonでBeautifulSoupライブラリを使用してウェブサイトを解析しようとしています。その中で、私は繰り返して開始リンクに従わなければなりません。BeautifulSoup次のような繰り返しのリンク
入力:リンクを開始、位置とカウント
は、n個のアンカータグを含むWebページを考えてみましょう(< =」「> HREF)。開始リンクを使用して私は特定のの位置の値にリンクを見つけることを見つける必要があります。
そこから私は上記のステップを繰り返さなければならない。カウント回。私は最後の要素を返す必要があります
import urllib
from BeautifulSoup import *
#start_link=input("\nEnter the starting point\n")
start_link='http://python-data.dr-chuck.net/known_by_Janae.html'
def get_last_link(link,position):
temp_variable=urllib.urlopen(link).read()
soup_variable=BeautifulSoup(temp_variable)
tags_variable=soup_variable('a')
t=tags_variable[position].get('href',None)
return t
def loop(link,times,i):
#link=start_link
while i<times:
temp=get_last_link(link,7)
i+=1
print temp
loop(temp,times,i)
loop(start_link,18,0)
このコードで私を助けてください。
ループ機能の最後のループ(temp、times、i)を削除する場合は、カウントを18にします。 – Neal
最後のコメントを無視してループの後に改行します。 – Neal