2011-07-29 11 views

答えて

8

はい、英数字などのURIでエスケープできないASCII(したがってUnicode)のサブセットです。しかし、Unicode文字セットの大部分はパーセント符号化されていなければなりません。

+1

Heh、スマートな答え。 RFC 3986で許可されているすべてのエスケープされていない文字は、実際にはUnicode文字です。それらはすべてASCII文字でもあります。 Unicodeは何とかASCII以外のものだと考えるのが一般的です。 –

2

URIURLはネイティブに、エスケープされていない非ASCII Unicode文字をサポートしていません。しかし、多くのサーバは、パーセントエンコードUTF-8またはローカライズされたANSIオクテットを使用する(ただし、指定のない方法実際に使用されていない)ことができます。標準化されたネイティブのUnicode処理の場合は、代わりにIRIを使用します。これは、URI/URLに代わる新しいプロトコルです。それはすべてのためにUTF-8エンコーディングを必要とし、IRIURIの間の変換方法のルールを提供します。

関連する問題