2016-11-24 9 views
0

を使用してHTML記号を取り除く私は、キーワード指定されたHTMLコード内のテキストのために成功した検索正規表現は、しかし、私はシンボルを取り除くことができない<または>は、正規表現

これは私の正規表現であります

[><][^><=]*climate[> - <][^<|//]* 

そして、この結果:

>Formation of coastal sea ice in North Pacific drives ocean circulation and climate< 

どんな提案してください?

+0

参照してください?どのような正規表現のスタイル?次の質問もご覧ください:http://stackoverflow.com/questions/181095/regular-expression-to-extract-text-from-html – sakurashinken

+0

「<.*>(。*)」 –

+1

http://stackoverflow.com/a/1732454/2864740 – user2864740

答えて

0

先と後読み代わりに、それらを一致させる見て追加:

(?<=[><])[^><=]*climate(?=[> - <])[^<|/]* 
^^^^^^^^^    ^^^^^^^^^^^ 

は、あなたがこれを解析するために使用しているどのようなプログラムDEMO

+0

すごくうれしい作品です!説明に感謝します! – jim

+0

@jim幸せに助けてください:) –

0

正規表現として[^<>]*climateを使用してください。これはそのトリックを行う必要があります。 または私はあなたの質問を誤解しましたか?テストや建物の正規表現のための

ニースヘルパー:http://regexr.com/