2012-01-22 15 views
1

私はこのようにマークアップされたテキストをたくさん持っている:私はその中にspanタグやテキストなどクラス=「セクション」を持っているすべてを削除する必要がストリップhtmlタグやコンテンツ

<span class="section">[<a href="blablabla">Section</a>]</span> 

を。私は正規表現かalternativetoを探していますこの作業を自動化します。

手がかりはありますか?

編集:私はこれを解決するのに役立つ何かまで、私は正規表現がより簡単な方法だと思った。私はPHPでコーディングしています。

ありがとうございました。

+0

反して答え、それは可能ですが、正規表現では簡単ではありません。より簡潔なのは、次のことを可能にする[tag:querypath]です。 – mario

答えて

2

セクションクラスタグに同じタイプの要素が含まれていない場合(スパンを含むスパンがないなど)、正規表現を使って簡単に行うことができます。

以下が最も簡単です:

$stripped = preg_replace('@<span class="section">.*?</span>@', '', $input); 

これを、あなたがそれを必要とする場合、任意のタグを可能にし、他の属性、およびその他のクラス:愚かな非へ

$stripped = preg_replace('@<(\w+)[^>]*class="[^"]*section[^"]*"[^>]*>.*?</\1>@', '', $input); 
+0

これはまさに私が必要としていたものです。ありがとう! – Peibol

関連する問題