パスからhtmlを抽出する正規表現

-1

私はRegexを初めて使う人です。ディレクトリパスから2つのものを抽出する必要があります。 ../path_to_html/myhtmlpage.html?additional_args_or_urlパスからhtmlを抽出する正規表現

どのようにしてhtmlの名前を取得できますか？ eg.myhtmlページ

どのようにURL全体を取得できますか？ eg.myhtmlpage.html？video_url = www.google.com /ビデオ

はどうもありがとうございました！ここで

2016-07-20 ELLEN CHEN

これらのローカルマシン上のファイルがありますか？あなたが解析したいURLがありますか？ –

最初に見つかった.htmlの出現を検索することはできませんか？ URLを知っているこの方法は、あなたが正規表現に慣れていない場合、あなたができる最善のことは、いくつかのドキュメントに座って、自分でそれを把握である.htmlを前に「\」の最後の間で、文字列 – limbo

の末尾に行きますあなたが理解していない正規表現をあなたの手に渡すと、長期的にあなたをうまくいきません。 –

あなたが行く：

import re 
url = "/path_to_html/myhtmlpage.html?video_url=www.google.com/video" 
# Name 
print re.findall(r'/(\w+)\.html', url)[0] 
# Entire url 
print re.findall(r'/(\w+\.html.*)', url)[0]

この版画：

myhtmlpage 
myhtmlpage.html?video_url=www.google.com/video

出典

2016-07-20 17:30:08 Ohumeronen

完璧に動作します！ありがとうございました！ –

うれしい私は助けることができました！ – Ohumeronen

受け入れることができますか？ – Ohumeronen

パスからhtmlを抽出する正規表現

答えて

関連する問題