私は、utf-8yのエンコーディングを持つxmlファイルを解析するためにsaxパーサーを使用しています。サックスパーサーや入力ソースでどのように指定できますか?私はいつも解析例外を受け取りますJavaでUTF-8Yとしてバイトを取得する方法
答えて
あなたはInputStream経由でファイルを読んでいると思いますか?パーサーは、XMLヘッダーからファイルの種類を判断できる必要があります。ファイルを文字列に読み込んだ後、それがひな形になる傾向があると解釈した場合
ヘッダーにはエンコードがありますこれは正しくない – Pan
申し訳ありませんが、ファイルのヘッダーにBOMマーカーがありますか?その場合、いくつかの回避策が文書化されています。 http://webcache.googleusercontent.com/search?q=cache:5JOKO1VNetQJ:bugs.sun.com/bugdatabase/view_bug.do%3Fbug_id%3D6206835+saxparser+utf-8+BOM&cd=1&hl=en&ct=clnk&source=www。 google.comファイルのXMLヘッダーにファイルの内容が間違っている場合は、BufferedInputStreamを使用してコンテンツをパーザに渡しながら書き直すことができます – Petesh
XML文書の 'encoding'値に 'Y'が含まれていることを確認してください。それで、私はあなたがエラーを受け取ったのに驚くことはありません。そのようなエンコーディングはありません。 これはドキュメントを作成したときにこれがエラーであると思われ、修正する必要があります。
- 「UTF-8」
- は、その「Y」を削除するために解析する前に、入力文書を修正エンコーディングとして渡して、入力ストリームからにInputStreamReaderを自分で構築:
しかし、あなたの側に
、次の2つの主要なオプションを持っていますそこから
最初のアプローチは簡単で、ほとんどのパーサーはそれで大丈夫です。最初に動作しない場合は、2番目のオプションを使用できます。
- 1. Java、バイト配列からバイトのコレクションを取得する方法
- 2. JavaのHTTPレスポンスサイズを取得する方法(バイト単位)
- 3. ByteBufferから残りのバイト(Java NIO)を1バイトだけ取得する方法
- 4. 11111111をJavaでバイトとして表現する方法
- 5. csvからバイトをバイトとして読み取る方法は?
- 6. WebBrowserコンポーネントでダウンロードしたバイト数を取得する方法
- 7. VBA WSツールキット、現在のファイルをバイト配列として取得する方法
- 8. Pythonでストリームをバイトとして読み取る方法3
- 9. javascriptを使用してイメージサイズをバイト単位で取得する方法
- 10. Javaでクライアントインターフェイスを使用してリモートファイルを取得する方法
- 11. トークンをJavaで取得する方法
- 12. Javaでオペレーティングシステムを取得する方法
- 13. JavaでMaprdbにアクセスしてレコードを取得する方法
- 14. Pythonでドメインリストの最初のバイトを取得する方法
- 15. バイトを文字列として読み取る方法
- 16. DataOutputStream.writeUTF()から読み取ったときにJava文字列の「元の」バイトを取得する方法は?
- 17. Arduinoからバイト単位で画像を取得し、Javaで
- 18. dataRowをxmlにシリアル化してバイト配列を取得する方法は?
- 19. SimpleXMLでInputNodeを文字列として取得する方法(Java)
- 20. Java-クラスとjarファイルのJavaコードを取得する方法
- 21. イメージJavaを使用してpostgresでバイト配列として保存および取得する
- 22. Firebaseデータベースがバイト配列として値を取得する
- 23. Javaを認証してURLを取得する方法
- 24. Javaを使用してClobを取得する方法
- 25. System.getPropertyを使用してJavaファイルクラス名を取得する方法
- 26. ファイル内容をバイトとして読み取るjava
- 27. タイルマップをJavaに取得する方法
- 28. Java NuLL_Pointer_Exceptionを取得する方法
- 29. メインフォルダとサブフォルダ名をJavaで取得する方法
- 30. フォームのテキストボックスとイメージ値を取得する方法Javaで
複製:http://stackoverflow.com/questions/5353783/why-org-apache-xerces-parsers-saxparser-does-not-skip-bom-in-utf8-encoded-xml – leonbloy