私は正規表現でかなり新しいです。基本的には、正規表現を使用して文字列から<sup> ... </sup>
を削除したいと思います。Pythonでhtmlタグと文字列を削除します
入力:
<b>something here</b><sup>1</sup><sup>,3</sup>, another here<sup>1</sup>
出力:
<b>something here</b>, another here
はそれを行う方法についてのその短い道と説明ですか?
注この質問は重複する可能性があります。私は試しましたが、解決策が見つかりませんでした。
正規表現はhtmlを処理する方法ではありません.htmlパーサーを使用してください。 htmlは単純な文字列ではなく、構造化されたデータです。最も使いやすいのはbeautifulsoupですが、それはあなたが使うことができるより効率的なライブラリのための唯一のラッパーです。 –
私は上記のような短い文字列のリストを持っています。私は正規表現を使用してhtmlパーサーを使用せずに動作すると思います – titipata