2016-08-02 6 views
9

emojisは明確に定義されたユニコード範囲を占有していますか?emojisをチェックできるUnicodeコードポイントの特定の範囲はありますか?

そして、コードポイントがpython 2.7の絵文字であるかどうかを確認する明確な方法はありますか?

これについての情報はありません。ソースのカップルは範囲を指摘している:

\U0001f600-\U0001f650 

しかし、例えば、この範囲外にあるコードポイント

\U0001f918 

を持っています。

ありがとうございました。

+0

調査の価値があるかもしれません:https://github.com/mathiasbynens/emoji-regex emojisの範囲を更新するために正規表現を動的に生成しています。 – Keozon

+1

私は、それは実際にはUnicode標準で定義されていることです。 – user2357112

+0

PythonのUnicodeサポートは組み込まれていませんか?つまり、Unicode.orgがさらに別のSMILING KITTYを追加するたびに、そのテーブルを再計算する必要がありますか? (これは同様の問題に関する別の答えで言及されていることを思い出してください) – usr2564301

答えて

5

regexはUnicodeプロパティでのマッチングをサポートしていますが、残念ながらemoji-specific propertiesはサポートされていません。一方

>>> regex.match(ur'\P{Emoji=yes}', u'') # NOTE: Doesn't (yet) work 

here's the emoji table from unicode.org:それがない場合は、それらを見つけることのように簡単になります。

+3

これは '#'や '*'のような文字を含みます。 。 'Emoji_Presentation = yes'でのフィルタリングはより選択的ですが、RIGHT ANGER BUBBLEのように絵文字と思われる文字は除外されるかもしれません。 – user2357112

関連する問題