私はRで作業しているテキストの中でabc
で始まる文字列のインスタンスを置き換えようとしています。出力テキストはいくつかのパスでHTMLで強調表示されますHTMLのキャレット内のテキストを無視するように置き換える必要があります。Rのネガティブ先読みが期待どおりに動作しない
次はPythonで動作するようですが、Rの正規表現にはヒットしません。すべてのサポートに感謝します。
test <- 'abcdef abc<span abc>defabc abcdef</span> abc defabc'
gsub('\\babc\\(?![^<]*>\\)', 'xxx', test)
予想される出力:
xxxdef xxx<span abc>defabc xxxdef</span> xxx defabc
代わりに、それはabc
のすべてのインスタンスを無視しています。
http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags – MichaelChirico