パーセント記号は\pS
シンボルではありません。それはとして、\pP
句読点です:
$ uniprops %
U+0025 ‹%› \N{PERCENT SIGN}
\pP \p{Po}
All Any ASCII Assigned Basic_Latin Common Zyyy Po P Gr_Base Grapheme_Base Graph GrBase Other_Punctuation Punct Pat_Syn Pattern_Syntax PatSyn POSIX_Graph POSIX_Print POSIX_Punct Print Punctuation X_POSIX_Graph X_POSIX_Print X_POSIX_Punct
あなたはあなたの好きなキャラクターはに属していることを一般的なカテゴリ(そしておそらくスクリプト)を理解しておく必要があります。ここにrunning unicharsからいくつかのサンプル出力を示します:
$ unichars -gs '[\pP\pS]' '\p{Block=Basic_Latin}'
U+0021 ! GC=Po SC=Common EXCLAMATION MARK
U+0022 " GC=Po SC=Common QUOTATION MARK
U+0023 # GC=Po SC=Common NUMBER SIGN
U+0024 $ GC=Sc SC=Common DOLLAR SIGN
U+0025 % GC=Po SC=Common PERCENT SIGN
U+0026 & GC=Po SC=Common AMPERSAND
U+0027 ' GC=Po SC=Common APOSTROPHE
U+0028 ( GC=Ps SC=Common LEFT PARENTHESIS
U+0029 ) GC=Pe SC=Common RIGHT PARENTHESIS
U+002A * GC=Po SC=Common ASTERISK
U+002B + GC=Sm SC=Common PLUS SIGN
U+002C , GC=Po SC=Common COMMA
U+002D - GC=Pd SC=Common HYPHEN-MINUS
U+002E . GC=Po SC=Common FULL STOP
U+002F /GC=Po SC=Common SOLIDUS
U+003A : GC=Po SC=Common COLON
U+003B ; GC=Po SC=Common SEMICOLON
U+003C < GC=Sm SC=Common LESS-THAN SIGN
U+003D = GC=Sm SC=Common EQUALS SIGN
U+003E > GC=Sm SC=Common GREATER-THAN SIGN
U+003F ? GC=Po SC=Common QUESTION MARK
U+0040 @ GC=Po SC=Common COMMERCIAL AT
U+005B [ GC=Ps SC=Common LEFT SQUARE BRACKET
U+005C \ GC=Po SC=Common REVERSE SOLIDUS
U+005D ] GC=Pe SC=Common RIGHT SQUARE BRACKET
U+005E ^GC=Sk SC=Common CIRCUMFLEX ACCENT
U+005F _ GC=Pc SC=Common LOW LINE
U+0060 ` GC=Sk SC=Common GRAVE ACCENT
U+007B { GC=Ps SC=Common LEFT CURLY BRACKET
U+007C | GC=Sm SC=Common VERTICAL LINE
U+007D } GC=Pe SC=Common RIGHT CURLY BRACKET
U+007E ~ GC=Sm SC=Common TILDE
だから、どちらか
[\pL\pN\p{Po}]
またはちょうどあなたが必要とする特定の文字を追加するように、あなたのクラスに右の一般的なカテゴリを追加します。ところで、ほんとに\pL
がほしいと思っているものは、ほとんどまたいつも\pM
が欲しいです。
'\ p {L}'は単なる文字で、 '\ p {N}'は単なる数字なので、正規表現ではスペースやパーセント記号を使用できません。 –
私は正規表現にnoobを使用していますが、スペースや%を受け入れる方法は?正規表現で変更する必要があるもの – user1149244
このようなregExを作成しました/^[\ p {L} \ p {N} \ p {S}] +/u。私がPHPマニュアルで読んだことは、シンボルとマッチしますが、まだ動作しません – user1149244