であれば、私は混合STRとUnicode文字列を持つことができ、リストをしたユニコードにリスト項目を変換しますパイソン - 項目は文字列
lst = ['string1', u'string2', 'string3', u'string4']
項目がstrのであれば、私はユニコード内のすべてのリスト項目を変換する必要があります。 unicodeにSTRを変換するために私が使用します。
s = s.decode('utf-8')
問題である文字列がすでにユニコードであり、私はそれを解読しようとした場合、非ASCII文字が含まれている場合、私はUnicodeEncodeErrorをを得ること:「ASCII」コーデックことができます」トンエンコード文字...
はので、私は何か考えた:
lst = [i.decode('utf-8') for i in lst if isinstance(i, str)]
をしかし、これは実際には、リストからUnicode文字列を削除します。
あなたは、Unicode文字列をコピーするには、 'else'を追加することができます。 – pushkin
おそらく、そのビジネスを落として、Unicodeの組み込みサポートを備えたPython 3.xに移行し、すべての文字列がデフォルトでUnicodeになっているので、 'unicode'タイプはありません。 – ForceBru
あなたは実際にUTF-8を解読する必要がありますか、あるいはあなたの 'str'文字列は本当にASCIIだけですか? –