Alphabetic
のようなUnicode文字の範囲のリストがhttp://www.unicode.org/Public/5.1.0/ucd/UCD.html#Alphabeticで定義されている必要があります。しかし、どのようにそれらを検索しても、Unicode文字データベースでそれらを見つけることはできません。誰かが指定したUnicodeプロパティを持つ文字の一覧や検索機能を提供できますか?Unicodeのアルファベット文字のリスト
答えて
派生コアのプロパティは、他のプロパティから計算できます。生成された:
アルファベットプロパティは次のように定義された呂+のL1 + Ltは+のLm +ロー+ N1を+ Other_Alphabetic
だから、あなたは呂、L1を、LT、Lmと、ロー内のすべての文字を取る場合、 Nl、およびOther_Alphabeticプロパティのすべての文字を使用すると、アルファベットの文字が表示されます。あなたのソースから
引用:Generated from: Lu + Ll + Lt + Lm + Lo + Nl + Other_Alphabetic
これらた略語はhereを説明しているように見えます。
ユニコード文字データベースは、配布物のすべてのテキストファイルで構成されています。それは以前と同じように単なるファイルではありません。
アルファベットのプロパティは派生プロパティです。
実際には、このためにコードポイント範囲を使用したくありません。 プロパティを正しく使用する場合はです。それはあまりにも多くあるからです。私たちは、他の16のアストラルプレーンを含める場合は、今私たちは14時だ
$ unichars '\p{Alphabetic}' | wc -l
10052
:unichars script使用して、我々はないカウント漢やハングルだけで基本多言語面でより1万一人であることを学びます千:
$ unichars -a '\p{Alphabetic}' | wc -l
14736
そして、我々は実際にはアルファベットプロパティはありません、我々はちょうど百何千ものコード・ポイントのオフに屋根を吹いた漢とハングルを、含まれている場合:
$ unichars -ua '\p{Alphabetic}' | wc -l
101539
ではなく、がコードポイントの範囲を使用してこれらを具体的に列挙したいと思います。その道が狂っている。
ちなみに、unichars scriptが便利な場合は となり、、おそらくuninames scriptが好きかもしれません。
あなたのスクリプトが本当に気に入りました!彼らは私が持っていた[SOの質問](http://stackoverflow.com/questions/6246651/generate-uri-friendly-unicode-code-points-from-integer-counter)を解決するために非常に便利です。それらを作ることに感謝します。質問:上記の最後のコマンド( 'unichars -ua '\ p {Alphabetic}' | wc -l')を実行したとき、101539の代わりに94332行が得られました。 –
@Abe:あなたはまだUnicode 6.0.0を実行していません。実行中のPerlのバージョンは何ですか? 'corelist -a Unicode'はPerlバージョンとUnicodeバージョンの組み合わせを表示します。ところで、私は今、私の[Unicode toolchest](http://training.perl.com/scripts/)で、さらに詳しいことがあります。 – tchrist
ああ、私はまだPerl 5を動かしています。間違いなくPerlをアップグレードし、新しいツールをチェックします。ありがとう! –
いい検索インターフェイスを提供するUniViewウェブアプリケーションが見つかりました。 (ローカルのチェックを外した状態で)Letterプロパティを検索すると、14723の結果が得られます。
- 1. C#リストのUnicode文字をロードする
- 2. Pythonで文字列のリストをUnicode文字に変換する
- 3. CのUnicode文字
- 4. FirebaseのUnicode文字
- 5. ハイブのUnicode文字
- 6. WHERE文字アルファベットのみの文字
- 7. プリントUnicode文字
- 8. マッチUnicode文字
- 9. アルファベット順の文字列リストの並べ替え(C)
- 10. JavaのUnicode文字の幅
- 11. C++ - アルファベット文字列
- 12. リストビュー内のUnicode文字C#
- 13. ReportLabの:中国/ Unicode文字
- 14. urllib.requestのUnicode文字列
- 15. タミル語のUnicode sri文字
- 16. JekyllカテゴリのUnicode文字
- 17. iTextのUnicode文字PDF
- 18. Python2.xのUnicode文字列からエスケープ文字(エスケープ文字のUnicode文字)を削除するには?
- 19. URL Unicode文字エンコード
- 20. Unicode文字列(パイソン)
- 21. Unicode文字列リテラル
- 22. MySQLとUnicode文字
- 23. Unicode置換文字
- 24. 出力でフィルタリングされるべきUnicode文字のリスト?
- 25. forループでUnicode文字のリストを生成します。
- 26. バッチファイルをUnicodeや '奇妙な'文字を含むアルファベット順に移動させる
- 27. Unicode非アルファベット文字に一致する方法はありますか?
- 28. アルファベット文字と数字Rとのマッチング
- 29. チェック文字列はUnicode文字
- 30. 文字列のアルファベット順とアルファベット順の並べ替え '
私の答えを見ると、[unicharsのスクリプトを使って、指定されたUnicodeプロパティを持つ文字の検索機能が提供されています](http://training.perl.com/scripts/unichars)。楽しい! – tchrist