私はすべての英数字以外の文字を削除したいが、unicodeのエンコードされた文字とアポストロフィを保持したいテキストを持っています。すべての非英数字文字が、私はアポストロフィを保存するために同じを行う方法がわかりません。明らかにre.sub(ur'[^A-Za-z0-9\'], '',text)
は、Unicodeでエンコードされた文字を取り除くために機能しません。何か案は?ユニコード符号化文字とアポストロフィ( ')を保持したまま英数字以外の文字を削除するにはどうすればよいですか?
1
A
答えて
1
あなたは文字クラス内の文字クラスの速記を使用することができます。
re.sub(ur"[^\w']+", "", text, flags=re.UNICODE)
0
を加えてre
にre.UNICODE
で、あなたはPY2 unicode
またはPY3 str
で作業している場合は、述語関数は、Unicodeの種類を認識しています。だから、あなたができる:
をこれはほぼ確実re
を使用するよりも遅いですが、私は完全を期すためにそれを言及したい考え出し。
関連する問題
- 1. '#'以外の英数字以外の文字を正規表現で文字列から削除するにはどうすればよいですか?
- 2. fineuploaderの保存ファイルから英数字以外の文字を削除する
- 3. 文字列に英数字以外の文字が含まれているかどうかを確認するにはどうすればよいですか?
- 4. アラビア語UTF8 +英文字列以外の英数字を削除する
- 5. 文字、数字、スペース、感嘆符、疑問符以外の文字列をすべて削除するには?
- 6. 英数字以外の文字列に含まれている「単語」を削除しますか?
- 7. 文字列の先頭に数字以外の文字を削除します
- 8. React Selectは、ドイツ語の文字(およびその他の英語以外の文字)を削除します
- 9. UTF8文字列から英数字以外の文字を削除する正規表現
- 10. Pythonの文字列をユニコードで符号化する
- 11. 英数字とスペースを除くすべての文字を除外します。
- 12. 番号から数字以外の文字を削除するeditText
- 13. 文字以外の文字を含む行を出力からどのように削除できますか?
- 14. 文字列内の連続した文字を削除するにはどうすればよいですか?
- 15. 文字列から数字、ドットまたはマイナス以外の文字列をすべて削除する方法
- 16. Vimでは文字以外の英数字のASCII値をどのように増減できますか?
- 17. 文字数の代わりに文字列を保持しながら、文字列のMAXをグループ化するにはどうすればよいですか?
- 18. Pythonは文字または数字まで文字を削除します
- 19. 文字列内の文字以外の文字をすべて削除する
- 20. 理解クエリ数字以外の文字を削除する
- 21. Pythonの文字列からutf以外の8文字を削除します
- 22. 文字列に数値または文字以外の数字、文字、文字が少なくとも1つ含まれているかどうかを確認するにはどうすればよいですか?
- 23. 文字列から引用符で囲まれた部分文字列を削除するにはどうすればよいですか? (Regexなし)
- 24. 英数字以外の文字を取り除いた後に取得
- 25. どのように文字列を定期的に文字を削除し、PHPで一意の文字を保持することができますか?
- 26. 文字列から文字を正しく削除するにはどうすればよいですか?
- 27. Java - 文字列のアルファベット以外の文字を検索するにはどうすればよいですか?
- 28. 文字列内の英数字、ハイフン、ピリオド、およびアンダースコア以外の文字をすべて置換します。
- 29. ggplotの英数字とギリシャ文字をgeom_text()に追加するにはどうすればよいですか?
- 30. preg_splitを英語で分割した文字列(英語以外の文字)
アポストロフィを持つ否定文字クラスの '\ w'はどうでしょうか? – chris85
're.sub(ur" [^ \ w '] + "、"、テキスト、フラグ= re.UNICODE) ' –