2016-06-23 22 views
4

を絵文字を交換します。は、私はこの文字列を持っている奇妙な文字で文字列の結果に

だから私はやってる:私がここにそれをコピーして貼り付けることができませんでしたので、私はスクリーンショットのように表示しています奇妙な結果を与える

import re 
emoji_re = re.compile(u'[' 
    u'\U0001F300-\U0001F64F' 
    u'\U0001F680-\U0001F6FF' 
    u'\u2600-\u26FF\u2700-\u27BF]+', 
    re.UNICODE) 
new = emoji_re.sub(r'', s) 

を。

enter image description here

不思議なあなたは、「印刷」は私に正しい結果を示していることがわかります。なぜこうなった?

+0

Fまたは私の[別の奇妙なこと](https://i.imgur.com/fXWLY7P.png)が起こっている。 –

答えて

1

私はそれをこのコードのideoneでショットました:

import re 

s = '☀️✈️✈' 
emoji_re = re.compile(u'[' 
    u'\U0001F300-\U0001F64F' 
    u'\U0001F680-\U0001F6FF' 
    u'\u2600-\u26FF\u2700-\u27BF]+', 
    re.UNICODE) 
new = emoji_re.sub(r'', s) 
print(new) 

を、出力は、まあ、一種の空でした。私はその後、追加唯一の種類のために:

出力
print(len(new)) 

:「私たちは、印刷できない文字を扱っているのを見て喜んでいたと、なぜあなたができることだ

をそれをここに貼り付けてください。文字列をエンコードするUTF-8に: '\のXeF \ xb8 \ x8f \のXeF \ xb8 \はx8f'


unicodelookupで出力

B

print(new.encode("utf-8")) 

探して正規表現がこの文字を逃しているようです:

variation selector-16 0xFE0F 
関連する問題