-2
HTMLの部分文字列の位置を取得しようとしています。難しい部分は、htmlが部分文字列の中にあるかもしれないということです。正規表現で文字列をHTMLに一致させる
例: 2nd
と一致させたいが、htmlでは一致する場合は、2<span class="super">nd</span>
と書いてある。
注:これは、任意の部分文字列だけでなく、「第一」、「第二」、ことができます...
はどのようにインラインHTMLの地上子のいずれかの種類に一致する要求を持つことができますか? 2nd
は 2nd
と2<span class="super">nd</span>
あなたは正規表現の一致を探しますが、取ることができますが一致し
\b2(<span[^>]*>)?n(<span[^>]*>)?d\b
に変換されています。だから、
sub = r'\b' + '(<span[^>]*>)?'.join(list(substring)) + r'\b'
: – schroedingersKat