2011-09-17 4 views

答えて

1

1)あなたはdecode()を使用しunicode()例えばISO-8859-2またはUTF-8のその表現(から入力された文字列デコード)とUnicodeオブジェクトを取得します。

>>> foo = u'łódź' 
>>> foo.__class__ 
<type 'unicode'> 

3)encode()エンコードへの入力を使用する:

2)あなたは、文字列はUnicodeとして扱われるべきであることを示すためにuを使用する(実際には結果オブジェクトは、Unicode型)でありますたとえば、UTF-8(またはお好みの任意の他の符号化)のために使用して文字列とstrオブジェクトを取得する:文字列/ユニコード/文字列のより良いアイデアを得るために、このarticle about unicode in Pythonをお読み

>>> foo = u'łódź' 
>>> foo.__class__ 
<type 'unicode'> 
>>> bar = foo.encode('utf-8') 
>>> bar.__class__ 
<type 'str'> 

エンコーディング混乱。

関連する問題