2012-04-25 3 views

答えて

4

"EF BF BF" はタイプミスで、あなたが "EF BB BF" を意味している場合:

はい、それは最初のバイトの場合。それらはファイルのendiannessを識別するために使用される "BOM"、Byte Order Markです。

UTF-16およびUTF-32エンコードファイルの場合、これは必須です。

UTF-8の場合、これはオプションです。たとえば、ISO-8859-1を予期しているコンテキストでBOMを持つUTF-8ファイルを使用すると、予期しない動作が発生することがあります。

編集: "EFのBFのBF" はタイプミスではない場合、それはどこでもファイルにnot valid UTF-8です。

+0

質問に関しては正しいですが、BOMはUTF-16とUTF-32では必須ではありません。参照:Unicode Standard、Ch。 3、http://www.unicode.org/versions/latest/ch03.pdf –

+0

@ JukkaK.Korpela:ありがとう、私は私の答えを更新します。 –

+0

説明ありがとうございます – ExtremeBlue