2017-04-16 9 views
0

は私がしたい私は正規表現pythonのtextfileからのみベースURLを取得するには?

テキストファイルを使用した唯一のベースURLを取得したい、詳細パスを持つ複数のURLを持つこの

www.facbook.com/abc/xyz 
www.google.com.pk/q=12hsjak 
www.yahoo.co.uk/avga/ajak 
defence.pk/zya/bahawalpur 
Pic2fly.uk/abc 

のようなURLを含むテキストファイルを持っているこの

Www.facebook.com 
Www.google.com.pk 
Www.yahoo.co.uk 
Defence.pk 
Pic2fly.uk 
のような出力

助けてください

私はこれを試しました

Print re.search(r'(https?://)?(www\.)?([^/]*)', url)[3] 
+0

何か試しましたか?何がうまくいかない? – Toto

+0

はい私は質問に追加しました – user7442628

答えて

1

os.path.splitまたはurlparseを試してみる必要はありません。

+0

'os.path.split'を使わないでください。たとえそれがほとんどの/すべてのオペレーティングシステムで動作していても、それは間違ったツールです。 –

0

私は、このようなリストを検索するだろう、リストの中に、内部(「/」)を持つすべてのURLを続けるだろう:

list1=['www.facbook.com/abc/xyz','www.google.com.pk/q=12hsjak','www.yahoo.co.uk/avga/ajak','defence.pk/zya/bahawalpur','Pic2fly.uk/abc'] 
i=0 
while i<len(list1): 
    print(list1[i][:list1[i].find('/')]) 
    i+=1 

結果はこのように、あなたが望むものである:

www.facbook.com 
www.google.com.pk 
www.yahoo.co.uk 
defence.pk 
Pic2fly.uk 
関連する問題