私はPythonで正規表現のマッチ関数を使っています。私は次のコードを持っています:イメージタグのリンクと正規表現との一致方法
def src_match(line, img):
imgmatch = re.search(r'<img src="(?P<img>.*?)"', line)
if imgmatch and imgmatch.groupdict()['img'] == img:
print 'the match was:', imgmatch.groupdict()['img']
上記はまったく正しく動作していないようです。これがあること(またはその両方が動作するはずのように、多分それはそうならば)なぜ
def href_match(line, url):
hrefmatch = re.search(r'<a href="(?P<url>.*?)"', line)
if hrefmatch and hrefmatch.groupdict()['url'] == url:
print 'the match was:', hrefmatch.groupdict()['url']
else:
return None
誰かが説明してくださいすることができます:私はこれで運を持っている一方でを行う?たとえば、href_match()関数に識別子に関する特別なものがありますか? 両方の関数で、私が探している文字列を含む行とその文字列の両方を渡していると仮定することができます。
EDIT: は私が私の好きなタグを取得することはありません確信していることを言及する必要があります:
<img width="200px" src="somefile.jpg">
この理由は、私はそれをHTMLを生成している特定のプログラムを使用していますということですそのようなタグを決して出すことはありません。この例では、私はいつものように、タグを取得するつもりだ仮定の中に純粋に理論的と解釈されるべきである。
<img src="somefile.jpg">
編集:ここ
は私が摂食していますラインの一例です関数は、入力引数と一致しません:
<p class="p1"><img src="myfile.anotherword.png" alt="beat-divisions.tiff"></p>
http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454 – Pepe
こちらの回答は下記のとおりです。後半のリンク)。これは少なくとも役立つものではなく、その質問に答えません。確かに、私が学ぶのを助ける私の問題に対する答えがあります。 – jml
以下の私の答えによれば、関数はどちらも私のために働きます(対話シェルのWindows 7のPython 2.7.1)。あなたはうまくいくはずの入力の反例を与えることができますか?失敗しますか? –