2017-07-18 1 views
1

一部の開始句読点文字(Unicode全般カテゴリPs)と開始引用符文字(Unicode全般カテゴリPi)は、次のコードポイントで適切な終了文字を持つことがあります。たとえば、(はU + 0028であり、)はU + 0029です。同様に、はU + 27EAであり、はU + 27EBです。しかし、«(U + 00AB)のような例外があります。一致する文字は»で、U + 00BBには16個のコードポイントがあります。Unicodeの一般カテゴリPsまたはPiの文字を指定すると、一致する終了文字は何ですか?

開始文字がある場合、適切な終了文字はどのようにして決定できますか?

(私は最終的にはPythonでこれを達成したいので、私はこの質問pythonをタグ付けしましたが、言語に依存答えは、あまりにも、結構です。)

編集:List of all unicode's open/close brackets?に私を指しているため感謝を。特に、this answerは、括弧の対(すなわち、PsおよびPe文字)を示しています。しかし、一致する引用符文字(PiPf文字)が鏡像にならないようにするには、のようにを開いているようです。

+1

の重複https://stackoverflow.com/questions/ 13535172/all-unicodes-list-of-close-bracket/13535350?私は答えを書こうと始めましたが、ほとんどの場合、答えと同じことを言っていることに気付きました。 – hobbs

+0

@hobbs - D:Dありがとう、ありがとう。 – zwer

+2

[すべてのユニコードのリストを開く/閉じる]の可能な複製?(https://stackoverflow.com/questions/13535172/list-of-all-unicodes-open-close-brackets) – zwer

答えて

0

質問の編集で説明したように、UnicodeデータファイルBidiBrackets.txtには、一致するすべての括弧文字が表示されます。開始文字はPsです。引用文字Pi用としては、これらのあまりにも多くはないので、私はちょうど手で最も明白なクロージング文字のように見えたものが見つかりました:おそらく

« » 
‘ ’ 
‛ ’ 
“ ” 
‹ › 
⸂ ⸃ 
⸄ ⸅ 
⸉ ⸊ 
⸌ ⸍ 
⸜ ⸝ 
⸠ ⸡ 
関連する問題