私はRegexを初めて使う人です。 ディレクトリパスから2つのものを抽出する必要があります。 ../path_to_html/myhtmlpage.html?additional_args_or_urlパスからhtmlを抽出する正規表現
どのようにしてhtmlの名前を取得できますか? eg.myhtmlページ
どのようにURL全体を取得できますか? eg.myhtmlpage.html?video_url = www.google.com /ビデオ
はどうもありがとうございました!ここで
私はRegexを初めて使う人です。 ディレクトリパスから2つのものを抽出する必要があります。 ../path_to_html/myhtmlpage.html?additional_args_or_urlパスからhtmlを抽出する正規表現
どのようにしてhtmlの名前を取得できますか? eg.myhtmlページ
どのようにURL全体を取得できますか? eg.myhtmlpage.html?video_url = www.google.com /ビデオ
はどうもありがとうございました!ここで
あなたが行く:
import re
url = "/path_to_html/myhtmlpage.html?video_url=www.google.com/video"
# Name
print re.findall(r'/(\w+)\.html', url)[0]
# Entire url
print re.findall(r'/(\w+\.html.*)', url)[0]
この版画:
myhtmlpage
myhtmlpage.html?video_url=www.google.com/video
これらのローカルマシン上のファイルがありますか?あなたが解析したいURLがありますか? –
最初に見つかった.htmlの出現を検索することはできませんか? URLを知っているこの方法は、あなたが正規表現に慣れていない場合、あなたができる最善のことは、いくつかのドキュメントに座って、自分でそれを把握である.htmlを前に「\」の最後の間で、文字列 – limbo
の末尾に行きますあなたが理解していない正規表現をあなたの手に渡すと、長期的にあなたをうまくいきません。 –