XMLファイルから不要だと思われるタグを削除しました。今私はそれを解析しようとすると、私のSAXパーサーはエラーをスローし、私のファイルが整形式ではないと言います。しかし、私はすべての開始タグが終了タグを持っていることを知っています。ファイルの開始タグには、XMLスキーマへのリンクがあります。これがトラブルの原因になるでしょうか?もしそうなら、私はそれをどのように修正するのですか?Python SAXパーサーがXMLファイルの形式が正しくないと言います
編集:私は問題を見つけたと思う。私のキャラクターデータには、おそらくhtmlタグから "& lt"と "& gt"文字が含まれています。解析後、これらは "<"と ">"文字に変換されます。これはSAXパーサーを悩ますようです。これが起こらないようにする方法はありますか?
http://validator.w3.org/ – bernie
XMLスキーマへの開始タグのリンクは名前空間である可能性があります。 – bernie
SAXからの実際のエラーを提供してくれますか? –