ユーザーが入力した文字列からUTF-8を削除する

インポートされたメソッドを使用せずに文字列からUTF-8シンボルを削除する方法はありますか？ユーザーが入力した文字列からUTF-8を削除する

例えば：

userString = "apples, pears \xc2\xa7 and bananas\ngrapes\nbananas !apples"

所望の出力：strを使用してbytesオブジェクトの

userString = "apples, pears and bananas\ngrapes\nbananas !apples"

出典

2017-06-20 Enesxg

これまでに何を試しましたか？ – jsalonen

'b '\ xc2 \ xa7''は' '§''です。これはセクション記号であり、およびではありません。 – Artyer

@jsalonen userString.replace（ "\ xc2 \ xa7"、 ""）でそのシンボルを直接対象にしようとしました – Enesxg

の変換は、あなたはエンコードエラーを処理する方法を指定することができますので、あなたはそのようにそれらを無視することができます。

>>> userString = b"apples, pears \xc2\xa7 and bananas\ngrapes\nbananas !apples" 
>>> str(userString, "ascii", errors="ignore") 
'apples, pears and bananas\ngrapes\nbananas !apples'

出典

2017-06-20 23:36:24 Eric

ユーザーが入力した文字列からUTF-8を削除する

答えて

関連する問題