2016-06-21 9 views
-2

私はPythonを学ぼうとしています。Xを含む文字列の一部をリストに追加します

ウェブページのソースファイルからすべてのHTMLリンクを取り出し、リストに追加したいと考えています。たとえば、../lyrics.*htmlのすべてのインスタンスの文字列を検索し、そのインスタンスをリストに挿入したいとします。結果は次のようなhtmlリンクのリストになります:

["../lyrics/steviewonder/lovesinneedoflovetoday.html", "../lyrics/steviewonder/haveatalkwithgod.html", "../lyrics/steviewonder/villageghettoland.html"] 

ヘルプは大歓迎です!ありがとうございました!

+0

どのようにhtmlを入手していますか? –

答えて

1

正規表現を使用して、このような文字列を検索することができます。

import re 

re.match(r"(.*)/lyrics/(.+?)html", line) 
関連する問題