のオリジナルマッチを変更するにはhtml
のテキストを<br>
タグで分割したいと思います。テキストが50文字より長い場合は、最後のスペースを10文字の前に置き換えます(<br>
)。re
テキストは、例えば<span class="value">TEXT</span>
である<span class="value">cccc cc cccccc cccc cc c</span>
ウィルはなった:<span class="value">cccc cc<br>cccccc<br>cccc cc c</span>
ので、すべての行が最大10個の文字を持つことができます。
私はこれのための正規表現を作成しましたが、おそらくそのようなタグを見つけることができますが、マッチしたグループからテキストを抽出して置き換える方法を見つけることができません。
snippet = re.sub(r'<span class="value">(.*)<\/span>',
r'<span class="value">\1<\/span>'.(divide text using <br> tags)
あなたはその方法を知っていますか?
Nooo ... do not **解析、処理、正規表現でXML/HTMLを生成します。 XPath、XSLT、BeautifulSoupを使用して... –