2017-06-22 4 views
0

私は "www.example.com"(引用符なし)のpython正規表現が必要です。 例には任意の文字列を使用できます。 私は「WWW」の前に他のテキストなしでそれを必要とし、「.COMURL "www.example.com"のためのpython正規表現

+1

あなたは、カスタム正規表現でURLを解析しない方がよいでしょう。ライブラリを使用してください。 URLはかなり複雑です:これらはユーザー名、パスワード、パス、クエリパラメータを含むことができます... –

+0

私はそれが私がちょうどパイソンの初心者であることを意味するか分かりません。 @WillemVanOnsem –

+0

urlparseを見てください:https://docs.python.org/3/library/urllib.parse.html – taras

答えて

1

後にあなたが標準ライブラリurllib.parse.urlparseから専用の機能を使用することができます。

>>> from urllib.parse import urlparse 
>>> parts = urlparse('http://www.example.org') 
>>> parts 
ParseResult(scheme='http', netloc='www.example.org', path='', params='', query='', fragment='') 
>>> parts.netloc 
'www.example.org' 

それとも、これを使用することができますテキストの正規表現:

>>> import re 
>>> regexp = re.compile(r'\s*(www\.[^:\/\n]+\.com)\s*') 
>>> urls = regexp.findall('Hello https://www.mywebsite.com/index.py?q=search bonjour...') 
>>> urls 
['www.mywebsite.com']