2016-08-04 58 views
0

リストのすべての要素から「u」を削除したいのですが、誰でも助けてくれますか?ユニコード文字列のリストを通常の文字列に変換する方法

[u'four', u'gag', u'prefix', u'woods'] 
+0

[こちら](http://stackoverflow.com/questions/1709110/what-does-u-mean-in-a-list) – dashiell

+1

「u」は、それらがユニコード文字列であると言います。彼らはほとんどの部分のための通常の文字列のように振る舞います – inspectorG4dget

+0

私はそれらを削除することができます方法はあります。 –

答えて

1

問題は文字列のエンコードにあります。これを行う :

l = [u'four', u'gag', u'prefix', u'woods'] 
l2 = [i.encode('UTF-8') for i in l] 

print l2 
['four', 'gag', 'prefix', 'woods'] 
+0

ありがとうございます –

1

uが、それは文字列の種類を伝える属性です。それがバイトストリングの場合、これはbになります。これらの型を呼び出すと、Stringを返します。 UnicodeとASCIIのような違いは、UnicodeはASCIIのスーパーセットで0-127で同じですが、異なるタイプの文字を表現する能力が高いことです。これらはUTF-8またはUTF-32でもかまいませんが、一般的には1バイトよりも大きいものです。

あなたがやりたいことの99%は同じように動作するはずですが、非常に特定の種類の文字列を必要とする機能を持っている場合は、エンコードを変更することもできます。

関連する問題