私はRegExベースのMarkdownパーサーを構築しています。リファレンススタイルのリンクラベルを探すためにRegExに取り組んでいる間、私はRegExのバグに遭遇しましたが、問題は見えません。なぜこの正規表現は数字と一致しないのですか?
次Markdownを考える:
[me]: http://example.com
[her]: http://somewhere.com
[1]: http://nhs.net
[2]: http://test.com
[google it]: http://google.com
そして、この正規表現:私だけを検出することができるように思わ
\[(\w+\s?+\w+)\]
[私]、[自分]と[それをグーグル]ではなく、ラベル[1]と[2]。 \w
は英字と数字の両方を検出すると思ったのですか?
編集:はPCRE正規表現パーサーを使用して
ICU、PCRE、JSのいずれかを使用している正規表現のフレーバーを共有できれば素晴らしいと思います。他の? –
状態がPCRE – Garry
に更新されました。私の代わりの提案では、PCREの '['と ']以外の文字にマッチする' '' '' '' '' '' –