Perlを使って文字列からHTMLを取り除くのはこれより簡単ですか?Perlを使用して文字列のHTMLを取り除くにはどうすればよいですか?
$Error_Msg =~ s|<b>||ig;
$Error_Msg =~ s|</b>||ig;
$Error_Msg =~ s|<h1>||ig;
$Error_Msg =~ s|</h1>||ig;
$Error_Msg =~ s|<br>||ig;
私は、スリム化された正規表現と、このような何か:
$Error_Msg =~ s|</?[b|h1|br]>||ig;
文字列から任意の/すべてのHTMLを取り除き、既存のPerl関数は、私が唯一の剥奪太字、H1ヘッダーおよびBRを必要としていても、ありますか?あなたが唯一の太字、H1年代とBRの
$htmlCode =~ s#</?(?:b|h1|br)\b.*?>##g
を削除する必要があり、あなたが考慮する必要があります場合は、コードを仮定し
私は言いたいことはないと思います。 regexesでHTMLをサニタイズしようとすると、この日と年齢では不合理です。 CPANの多数のHTMLサニタイズモジュールの1つを使用してください。好ましくは、XSSの脆弱性を防止するために設計されたもので、Daniel Muey氏によって作成されたものではありません。 –
HTML :: StripはUTF-8でエンコードされた文字列を正しくサポートしていません。回避策についてはこちらを参照してくださいhttps://gist.github.com/910818 – nick