2016-07-19 9 views

文字列のすべてを取り除いて<span class="notranslate">*any text*</span>の文字列を取り込もうとしています(HTMLを解析する必要はありません。私は他のタグを保持したいので、タグは削除するために正確に一致する必要があります)。与えられた文字列に少なくとも1つのタグがあり、上限はありません(2つ以上のものは珍しいでしょうが)regexを使用して特定の(繰り返しの可能性がある)パターン以外のすべてをキャプチャする



Dear <span class="notranslate">$customer</span>, I am sorry that you are having trouble logging in. Please follow the instructions at this URL <span class="notranslate">$article431</span> and let me know if that fixes your problem.

Dear <span class="notranslate">John Doe</span>, I am sorry that you are having trouble logging in. Please follow the instructions at this URL <span class="notranslate">http://url.for.help/article</span> and let me know if that fixes your problem.

Dear , I am sorry that you are having trouble logging in. Please follow the instructions at this URL and let me know if that fixes your problem.
Dear <span class="notranslate"></span>, I am sorry that you are having trouble logging in. Please follow the instructions at this URL <span class="notranslate"></span> and let me know if that fixes your problem.
両方のために、私は簡単にString.Equals()を実行し、それらが等しいかどうかを調べることができます。 (変数を置き換えた複数のテキストと入力変数を比較して一致するものを見つける必要があります)

文字列に "not notllate"があるかどうかを簡単に知ることができました"セクション:(<span class="notranslate">(.+?)</span>)、これは私が比較の前にセクションを取り除く必要があるかどうかを決定する方法です。しかし、私は上記の(私は非常に似たような)仕事に多くの問題を抱えています。

私はExpressoとregexstorm.netをテストに使用しており、(?:(.+?)(?:<span class=\"notranslate\">(?:.+?)</span>))のさまざまなバリエーションを使用していますが、他のSO質問のアイデアを使用していますが、それらのすべてがわかりません。たとえば、Expressoではほとんど機能するようですが、最後のスパンタグの後には終了テキストを取得することはできません。スパンタグをオプションにするか、最後に別の(。+?)を追加しようとすると、何も取得できません。先読みを使ってみましたが、後でタグ+内部テキストを後で取得してしまいます。



string data = "Dear <span class=\"notranslate\">$customer</span>, I am sorry that you\r\n are havin" + "g trouble logging in. Please follow the instructions at this\r\n URL <span class=" + "\"notranslate\">$article431</span> and let me know if\r\n that fixes your problem."; string pattern = @"(?<Words>[^<]+)(?<Ignore><[^>]+>[^>]+>)?"; Regex.Matches(data, pattern) .OfType<Match>() .Select(mt => mt.Groups["Words"].Value) .Aggregate((sentance, words) => sentance + words); 

結果は、元のキャリッジリターンとラインを持っている文字列は、実際にあなたの例ではフィードのですか?あなたの最初の正規表現を使用し、各一致を空の文字列で置き換えます。 – 4castle


親愛なる神。うん、それはうまくいく。私はregexesを初めて使用することに夢中になり、トンネルビジョンを開発しました。ありがとう。 – violaceous


Phew!それはあなたが思っていたよりも簡単だと分かったとき、いつもいい感じです。うれしいです:) – 4castle




Dear , I am sorry that you 
    are having trouble logging in. Please follow the instructions at this 
    URL and let me know if 
    that fixes your problem. 