にXMLエンティティをエスケープXMLエンティティとしては、だから私は、XMLファイル内でこのUTF-8文字列を持っているバックUTF-8
Horrible place. ☠☠☠
この文字列をUTF-8に変換するにはどうすればよいですか?おそらくこれは本当に簡単な解決策ですが、私は標準ライブラリで何も見つけることができません。例えば。 CGI.unescapeHTML
(>
のようにうまく機能する)は、それらを完全に無視するようです。
ree-1.8.7-2010.02 > CGI.unescapeHTML('>')
=> ">"
ree-1.8.7-2010.02 > CGI.unescapeHTML('☠')
=> "☠"
賢い、ありがとう!エンティティを保持していた 'doc.to_xml'を呼び出していました。 – jpatokal
これは 'to_xml'がXML表現を作成するためです。 –