2017-05-07 5 views
0

私のワードプレスは最近ハッキングされました。今や、何年ものXMLデータベースバックアップからすべての製薬リンクをきれいにしようとしています。スパムリンクを削除するための正規表現

RegExはそれを行う方法ですが、私は専門家ではありません。私はかなり表現することができません。私は、viagraまたはcialisという単語を含むリンクを検索し、タグ全体を何も置き換えない式を作成しようとしています。

これは私がこれまで持っているものです...

(<a href=".*(viagra|cialias).*>)(.*)(<.a>) 

それは動作します - しかし、彼らが近くにいるときにも良いのリンクをピックアップ。例えば、それは私はそれがgastritis </a>

後、私は現在、ちょうど式を実行するためにhttp://regexr.com/を使用しています停止する必要が

<a href="http://buy-viagra.net/" style="text-decoration:none;color:#676c6c">gastritis</a> check out <a href="http://www.good.is/post/junkan-fixies-from-tokyo-to-osaka/">Junkan</a>, a short version of <a href="http://www.tokyo2osaka.com/">Tokyo to Osaka</a> made especially for <a href="http://www.good.is/">Good</a> 

...このすべてを選択します、そして、私はコピーしてからペーストする計画しました'replace'タブをXMLファイルに戻します。

(あなたが正規表現の達人している場合と、大文字と小文字でバイアグラやシアリスのための表現の検索をすることは素晴らしいだろう!)

答えて

0

あなたが探しているものを、このですか?大文字と小文字を区別するためのフラグi

<a\s*href\s*=\s*".*(viagra|cialis)[^>]*>[^<]*<\s*\/\s*a\s*>

https://regex101.com/r/cTKHa3/2

関連する問題