2017-03-15 10 views
0

HTMLページやテキストファイルから同じ行に複数のリンクを見つけてパスを返すことができます。 現時点では、私はその行の最初のリンクを見つけることができますが、同じ行に2つのリンクがある場合、それは動作しません。同じ行に複数のリンクを見つけてパスを返す

def get_href(line) : 
    x = line.find('href=') 
    if x < 0 : return 
    ref = line[x+6:].split('"')[0] 
    if ref.startswith('http:') : return ref 

hrefs = [] 
flux = urlopen('http://www.python.org/') 
for line in flux : hrefs.append(get_href(line)) 
+0

は ' "HREF"'上 'line'コンテンツ – RomanPerekhrest

+1

どう分割について' ligne'を示して? –

+0

'line'コンテンツは、どのWebサイトやページからでも入手できます。私は行ごとに文字列を取得します。 – user2182652

答えて

0

私はこれを試してみて、私はそれがうまくいくと思う:

def get_href(line) : 
    tab = [] 
    link = [] 
    x = line.find('href=') 
    if x < 0: pass 
    else : 
     tab = line.split('"') 
     for ref in tab: 
      if ref.startswith('http:') or ref.startswith('https:') : link.append(ref) 
     print link 
関連する問題