これはプログラミング言語とその文字列処理オプションによって異なります。
たとえば、Java文字列の場合、文字列にリテラル・バックスラッシュが必要な場合は、その文字列を二重にする必要があります。したがって、正規表現\n
は"\\n"
と書かれていなければなりません。正規表現を使ってバックスラッシュをマッチさせる場合は、Javaの文字列ハンドラの場合は1回、正規表現エンジンの場合は1回、エスケープする必要があります。したがって、\
と一致するには、正規表現は\\
であり、対応するJava文字列は"\\\\"
です。
多くのプログラミング言語には、バックスラッシュをエスケープする必要のない特別な「逐語的」または「生の」文字列があります。したがって、正規表現\n
は、通常のPython文字列として"\\n"
、またはPython生の文字列としてr"\n"
と書くことができます。 Python文字列"\n"
が実際の改行文字です。
バックスラッシュをエスケープしないと動作しないことがあるので、混乱することがあります。たとえば、Pythonの文字列"\d\n"
は、改行の後に数字と一致する正規表現として動作します。これは、\d
がPython文字列で認識される文字エスケープシーケンスではないため、リテラル\d
として保持され、その方法で正規表現エンジンに送られるからです。 \n
は実際の改行に変換されますが、正規表現がテストされる文字列の改行と一致します。
しかし、結果のシーケンスが有効な文字エスケープシーケンスであるバックスラッシュをエスケープした場合、悪いことが起こります。たとえば、正規表現\bfoo\b
は、単語全体がfoo
と一致します(但し、foobar
のfoo
と一致しません)。正規表現文字列を"\bfoo\b"
と書くと、\b
は文字列プロセッサによってバックスペース文字に変換されるので、正規表現エンジンは明らかに失敗する<backspace>foo<backspace>
と一致するように指示されます。
解決策:常にあなたがそれらを持って逐語的文字列使用するか、またはあなたがそれらを持っている正規表現リテラルを使用(E GのJavaScriptのとRubyの/.../
。。)(。E GをPythonのr"..."
、.NETの@"..."
。)。または、RegexBuddyを使って正規表現をあなたの言語の特別なフォーマットに自動的に翻訳してください。
はあなたの例に戻って取得するには、次の正規表現が意味
\\n
として正規表現は「マッチバックスラッシュや改行文字のいずれかを」手段として
[\\\n]
「n
バックスラッシュに続く、一致」を。
テストしましたか?あなたが簡単に試すことができるものと思われます。 – yoda
あなたはそれらをどこに見ますか?プログラミング言語の文字列ですか?あなたは "\ n"をエスケープする必要があるので、多くのプログラミング言語で "\ n"が実際に "\ n"であることを考慮していますか?したがって、正規表現が見ているのはちょうど '\ n'です –