2009-10-07 33 views
9

latin1文字を含む文字列をutf8に変換するにはどうすればよいですか?latin1文字列をutf8に変換しますか?

文字列は、open-uriによって開かれ、これらの特殊文字を含むドキュメントです。

敬具あなたのタグから判断

答えて

16

Iconv

require 'iconv' 
i = Iconv.new('UTF-8','LATIN1') 
a_with_hat = i.iconv("\xc2") 
4

、私はあなたがこのような何かしたいと思います:あなたは、URIの使用を文字セットわからない場合は

require 'rubygems' 
require 'open-uri' 
require 'nokogiri' 
require 'iconv' 

file = open(your_uri) 
doc = Nokogiri::HTML(Iconv.conv('utf-8', 'latin1', file.readlines.join("\n"))) 
doc.xpath(your_xpath) 

を、 file.charsetを使用して、​​の代わりに文字セットを取得できます。

関連する問題