xmlファイルを処理(Unmarshall)している間に、XMLエンコーディングに疑問を持っています。 xmlファイルのエンコーディングは、ファイルの先頭に次のように指定します。プログラムはxmlファイルのエンコーディングをどのように決定しますか?
<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
私の質問は、この行を読んだ後、次の内容がUTF-8でエンコードされていると判断したことです。しかし、この最初の行を読むために、プログラムはUTF-8でコード化されているとどのように判断しますか?私は、バイトストリームを読んでいる間、プログラムはどのように最初の行のどのエンコーディングを使用する必要があることを知っているのですか?
よろしく、 Mayuran
** **あります。私は仕様を見ていて、それがそこにあることを知っていましたが、あなたが上記を投稿する前にF.1にかなり落ちていませんでした。良いですね。 –
@RobAu、答えをありがとうが、私はまだ理解できない、 "<?xml"というテキストを読むには、最初にエンコーディングを決める必要がありますか?エンコーディングを決めることなく、それは "<?xml"であることをどのように知っていますか?私はUTF-8エンコーディングは "<?xml"だと信じています。他のエンコーディングを使用すると、異なる文字セットとして解釈される可能性があります。ちょうど私の考えだけ。私が間違っている場合は私をクリアしてください。 – Mayuran
バイトオーダーマークがない場合は、最初の数バイトを読み込み、UTF-16などの異なるエンコーディングを試してください。文字列 '<?xml'を与えるエンコーディングは、行の残りの部分を読み込むために使用する必要があります。 – RobAu