2017-04-19 17 views
-2

HTMLの部分文字列の位置を取得しようとしています。難しい部分は、htmlが部分文字列の中にあるかもしれないということです。正規表現で文字列をHTMLに一致させる

例: 2ndと一致させたいが、htmlでは一致する場合は、2<span class="super">nd</span>と書いてある。

注:これは、任意の部分文字列だけでなく、「第一」、「第二」、ことができます...

はどのようにインラインHTMLの地上子のいずれかの種類に一致する要求を持つことができますか? 2nd2nd2<span class="super">nd</span>

+0

あなたは正規表現の一致を探しますが、取ることができますが一致し\b2(<span[^>]*>)?n(<span[^>]*>)?d\b

に変換されています。だから、

sub = r'\b' + '(<span[^>]*>)?'.join(list(substring)) + r'\b'

: – schroedingersKat

答えて

0

は、私は簡単な解決策を見つけましたその一部だけを[キャプチャグループ](http://www.regular-expressions.info/brackets.html)を使用します。
関連する問題