一部の開始句読点文字(Unicode全般カテゴリPs
)と開始引用符文字(Unicode全般カテゴリPi
)は、次のコードポイントで適切な終了文字を持つことがあります。たとえば、(
はU + 0028であり、)
はU + 0029です。同様に、⟪
はU + 27EAであり、⟫
はU + 27EBです。しかし、«
(U + 00AB)のような例外があります。一致する文字は»
で、U + 00BBには16個のコードポイントがあります。Unicodeの一般カテゴリPsまたはPiの文字を指定すると、一致する終了文字は何ですか?
開始文字がある場合、適切な終了文字はどのようにして決定できますか?
(私は最終的にはPythonでこれを達成したいので、私はこの質問python
をタグ付けしましたが、言語に依存答えは、あまりにも、結構です。)
編集:List of all unicode's open/close brackets?に私を指しているため感謝を。特に、this answerは、括弧の対(すなわち、Ps
およびPe
文字)を示しています。しかし、一致する引用符文字(Pi
とPf
文字)が鏡像にならないようにするには、’
のように‘
を開いているようです。
の重複https://stackoverflow.com/questions/ 13535172/all-unicodes-list-of-close-bracket/13535350?私は答えを書こうと始めましたが、ほとんどの場合、答えと同じことを言っていることに気付きました。 – hobbs
@hobbs - D:Dありがとう、ありがとう。 – zwer
[すべてのユニコードのリストを開く/閉じる]の可能な複製?(https://stackoverflow.com/questions/13535172/list-of-all-unicodes-open-close-brackets) – zwer