2012-01-18 5 views
1

として ' 'を返します。私は最近、JSoupライブラリ1.3.3(かなり古い、私は知っている)という奇妙な振る舞いにぶつかりました。Java JSoupライブラリelement.text()は、#012 ASCII文字として

テキストノードを解析し、そしてこれは#160のASCII文字この要素上)(.textセクションを呼び出すことによって変換される エンティティconatins。

これは経験がありますか?これは正しい動作だと思いますか?

おかげで、改行なしスペースがない通常空間と同じである

答えて

3

(エラーのチェックをJsoupレポ、どれが見つかりませんでした)。 ISO-8859- *、Windows-1252では0xA0または160の10進数で、UnicodeではU + 00A0です(UTF-8では0xC2 0xA0にエンコードされます)。正確なエンコーディングに応じて、これは正しい動作です。

+0

お返事ありがとうございます。 – jppalencar