私はDjango tutorialにこの一節つまずい:UnicodeとPython/DjangoでのUTF-8の混乱?
Djangoのモデルは ユニコード()を呼び出し、UTF-8バイト文字列に変換し、結果をデフォルト STR()メソッドを持っています。これは、unicode(p)がUnicode文字列を返し、str(p)が文字列がUTF-8としてエンコードされた通常の文字列を返すことを意味します。
afaikユニコードは特別な表現ではないので、私は混乱しています。したがって、Pythonでは「Unicode文字列」とは何ですか?それはUCS-2を意味しますか? this "Python Unicode Tutorial"を上げグーグルで大胆にUnicodeは、世界の共通記述システムのすべてをカバーして2バイトのエンコーディングです
を述べています。
これは間違っているのですか?私は文字セットとエンコーディングの問題で何度も混乱してきましたが、ここで私が読んでいるドキュメントは混乱していると確信しています。誰かが私に「Unicode文字列」を与えるとき、Pythonで何が起こっているのかを知っていますか?
他の選択された「回答」が選択されていても、この回答を投票してください。 – tzot
[肩こり]両方とも正しいです。それは実際にUnicode文字列*が何であるかを定義する 'len('ΤΖΩΤΖΙΟΥ ')== 8の意味です。 – bobince
私は同意しません。私はその質問を読んで、「PythonでUnicode文字列とは何か」と言う。選択された答えはランダムな文章のメッシュのように見えますが、あなたの答えはもっと重要な点です。しかし、これは私が追求しない問題です。乾杯:) – tzot