0
xerces-cはすべての文字をデフォルトのエンコードにデコードしますか?もしそうなら、このデフォルトのエンコーディングをユーザ指定にすることができます。xerces-cにはデフォルトのエンコーディングがありますが、変更できますか?
コールバック
DefaultHandler::characters(const XMLCh *const chars, const XMLSize_t length)
のchars
引数UTF-8でエンコードされたXMLを解析中には、UTF-8ではなくなります。たとえば、UTF-8のポンド記号0xC2 0xA3
は、0x00 0xA3
と表示されます。これは、xerces-cが文字列をデコードしているのに対し、xerces-cはそうしたくないと結論づけます。私は自分自身でデコードを処理したいと思います。