2016-07-20 7 views
-1

私はRegexを初めて使う人です。 ディレクトリパスから2つのものを抽出する必要があります。 ../path_to_html/myhtmlpage.html?additional_args_or_urlパスからhtmlを抽出する正規表現

どのようにしてhtmlの名前を取得できますか? eg.myhtmlページ

どのようにURL全体を取得できますか? eg.myhtmlpage.html?video_url = www.google.com /ビデオ

はどうもありがとうございました!ここで

+0

これらのローカルマシン上のファイルがありますか?あなたが解析したいURLがありますか? –

+0

最初に見つかった.htmlの出現を検索することはできませんか? URLを知っているこの方法は、あなたが正規表現に慣れていない場合、あなたができる最善のことは、いくつかのドキュメントに座って、自分でそれを把握である.htmlを前に「\」の最後の間で、文字列 – limbo

+0

の末尾に行きますあなたが理解していない正規表現をあなたの手に渡すと、長期的にあなたをうまくいきません。 –

答えて

0

あなたが行く:

import re 
url = "/path_to_html/myhtmlpage.html?video_url=www.google.com/video" 
# Name 
print re.findall(r'/(\w+)\.html', url)[0] 
# Entire url 
print re.findall(r'/(\w+\.html.*)', url)[0] 

この版画:

myhtmlpage 
myhtmlpage.html?video_url=www.google.com/video 
+1

完璧に動作します!ありがとうございました! –

+0

うれしい私は助けることができました! – Ohumeronen

+0

受け入れることができますか? – Ohumeronen

関連する問題