私は特定のWebページから削り取ったテキスト内のすべての余分なHTMLタグを取り除こうとしていますが、Pythonのstr.replace()
は<br>
と=
のようなターゲットでは機能していないようです<li></li>
などの他のタグは正常に置き換えられます。Pythonでstr.replace()<br>または '='を使用するにはどうすればよいですか?
ここに私のコードです。
str(txt).replace('<li>', '')
.replace('</li>', '')
.replace('<ol>', '')
.replace('</ol>', '')
.replace('<br>', '')
.replace('=', '')
アドバイスをいただければ幸いです。
可能な重複(http://stackoverflow.com/questions/753052/strip-html-from -strings-in-python) –