2
Python正規表現を使用して一部の文字を削除しようとしていますが、文字列からUnicode以外のように見えます。Python非Unicode文字を削除する正規表現
>>> xxx='Juliana Gon\xe7alves Miguel'
>>> t=re.sub('\w*','',xxx)
>>> t
' \xe7 '
これの\ XE7私は削除しようとしているものです:
xxx='Juliana Gon\xe7alves Miguel'
t=re.sub('\w*','',xxx)
t
結果は同様である: はここに私のコードです。 誰にでもアイデアはありますか?
:すべてのASCII文字
(?!)
のための短くて読みやすいバージョン。あなたはそれが正しいはずの手紙に変換したいですか? –私はそれを理解したと思う。'xxx = 'Juliana Gon \ xe7alves Miguel' t = re.sub( '\ w *'、 ''、xxx).strip()、 ''、xxx) t' –