5
いくつかのバイトシーケンスは、Unicodeエンコーディングでは無効であると思われますが、いくつかの言語(Pythonは1つ)でエラーが発生することがわかりました。UnicodeとJavascript:無効なバイトシーケンス
私の質問は:XMLHttpRequest
またはXDomainRequest
の間にこのようなシーケンスを受け取った場合、Javascriptではどうなりますか?結果の文字列は次のようになります。
- これが発生した場合、切り捨てられますか?
- 不良シーケンスをスキップし、次のバイトから開始しますか?
- 復号化を続行し、表示されたときに置換 文字のみを表示しますか?
3の場合、charCodeAt
関数は有効な文字コードを返しますか?
OK、ありがとう、それは私が探していたものでした。記録のために、私は[this page](http://www.cl.cam.ac.uk/~mgk25/ucs/examples/UTF-8-test.txt)を使って確認し、 'charCodeAt'を繰り返しています値。 –
素晴らしいテストリソース:http://www.cl.cam.ac.uk/~mgk25/ucs/examples/UTF-8-test.txt – saml