2016-12-10 8 views
0

私はPythonでBeautifulSoupライブラリを使用してウェブサイトを解析しようとしています。その中で、私は繰り返して開始リンクに従わなければなりません。BeautifulSoup次のような繰り返しのリンク

入力:リンクを開始、位置カウント

は、n個のアンカータグを含むWebページを考えてみましょう(< =」「> HREF)。開始リンクを使用して私は特定のの位置の値にリンクを見つけることを見つける必要があります。

そこから私は上記のステップを繰り返さなければならない。カウント回。私は最後の要素を返す必要があります

import urllib 
from BeautifulSoup import * 
#start_link=input("\nEnter the starting point\n") 
start_link='http://python-data.dr-chuck.net/known_by_Janae.html' 

def get_last_link(link,position): 
    temp_variable=urllib.urlopen(link).read() 
    soup_variable=BeautifulSoup(temp_variable) 
    tags_variable=soup_variable('a') 
    t=tags_variable[position].get('href',None) 
    return t 

def loop(link,times,i): 
    #link=start_link 
    while i<times: 
     temp=get_last_link(link,7) 
     i+=1 
     print temp 
     loop(temp,times,i) 

loop(start_link,18,0) 

このコードで私を助けてください。

答えて

0

最後のループの後に改行を挿入します。

+0

ループ機能の最後のループ(temp、times、i)を削除する場合は、カウントを18にします。 – Neal

+0

最後のコメントを無視してループの後に改行します。 – Neal

関連する問題