私は少しPythonのnoobで、ここで何が起こっているのかを理解するのに問題があります。私はURLエンコードされた文字列をデコードしています。私はファイルdump®.txt
を持っています(先頭のスペースが目的にあります)。私は期待していたurllib.unquote_plusは同じ文字列で別の出力を返します
>>> string1 = u'+dump%C2%AE.txt'
>>> print urllib.unquote_plus(string1)
dump®.txt
>>> string2 = '+dump%C2%AE.txt'
>>> print urllib.unquote_plus(string2)
dump®.txt
がstring1
とstring2
(または多分逆動作)についてのみ®
の文字を見ることだった。私は私のオブジェクトの種類を変更すると、私は2つの異なった結果が得られます。誰も私が私の希望を得る前にstring1
が文字列タイプである必要がある理由を理解するのを助けることができますdump®.txt
?
*私はUTF-8にURLエンコードされた文字列をデコードしようとしています。 utf-8はエンコーディングです。 – wim