2011-07-18 1 views
2

HTMLEntitiesを使用してHTMLストリングをデコードしています。今日私はそれを見た& nbsp; 194代わりにHTMLEntitiesは をascii 194にデコードしますが、それは160ではありませんか?

jruby-1.6.2 :002 > HTMLEntities.new.decode(" ")[0] 
=> 194 

160のにデコードさは194正しいですか、私は間違って何か(RubyでUTF-8文字列で多分何かを)やっていますか?

(= 1.6.2はJRuby、Railsの= 2.3.11、にhtmlentities = 4.3.0)

答えて

3

何を見ていると、2バイトのUTF-8シーケンスの最初のバイトです。アンパックして、期待されるUnicodeコードポイントを確認してください:

HTMLEntities.new.decode(" ").unpack('U*')[0] 
+0

ありがとうございます!それはすべてを説明する! – dinfuehr

関連する問題