正規表現を使用してURLからすべての画像をダウンロードしようとしています。Python 2.7画像URLの正規表現
私は現在だけで画像のURLを必要とする、私は現在、これは任意の画像のURLを見つけていない
def urlimage(text):
'''finds image url'''
imageurl = []
imageurl = re.findall(r'https?:\/\/.*\.(?:png|jpg)', text)
return imageurl
を使用しています。 私の正規表現に問題があるのですか、それとも私はこの間違いを起こしていますか?
だから、すべてのURIが 'httpで開始しません://'や 'https://で'、またはそれらの一部の相対URIはありますか? BeautifulSoupなどを使用している場合、これはHTML文書ですか?最後に、 '\。*'はおそらく '\。*?'でなければなりません。 –
ObLink:[正規表現を使用してHTMLを解析しない](http://stackoverflow.com/a/1732454/4014959) –