2017-06-20 3 views
0

インポートされたメソッドを使用せずに文字列からUTF-8シンボルを削除する方法はありますか?ユーザーが入力した文字列からUTF-8を削除する

例えば:

userString = "apples, pears \xc2\xa7 and bananas\ngrapes\nbananas !apples" 

所望の出力:strを使用してbytesオブジェクトの

userString = "apples, pears and bananas\ngrapes\nbananas !apples" 
+0

これまでに何を試しましたか? – jsalonen

+0

'b '\ xc2 \ xa7''は' '§''です。これはセクション記号であり、およびではありません。 – Artyer

+0

@jsalonen userString.replace( "\ xc2 \ xa7"、 "")でそのシンボルを直接対象にしようとしました – Enesxg

答えて

0

の変換は、あなたはエンコードエラーを処理する方法を指定することができますので、あなたはそのようにそれらを無視することができます。

>>> userString = b"apples, pears \xc2\xa7 and bananas\ngrapes\nbananas !apples" 
>>> str(userString, "ascii", errors="ignore") 
'apples, pears and bananas\ngrapes\nbananas !apples' 
関連する問題