2009-03-28 13 views
0

Rubyでhttp get_responseデータを解析しようとするたびにParseExceptionが発生します。例外は、データに '&'が存在するためです。これをどうすれば解決できますか?Ruby XMLParsing例外

生の文字列で不正な文字 '&'(REXML ::はParseException)

答えて

0

を使用すると、パーサーXMLに渡しているデータですか?他のパーサーはそれについて文句をしますか?

0

解析しようとしているデータが正しい形式のXMLであることを確認してください。あなたがHTMLやRSSをWebから渡そうとしているのであれば、それはほぼ確実に整形式のXMLではありません(HTMLはXMLではありませんが、XHTMLかもしれませんが、RSSはXMLであるはずですが、 RSSジェネレーターは一般的なRSSではありません。

HTMLを解析する必要がある場合は、Hpricotを試してください。 RSSを解析する必要がある場合は、組み込みのRSSパーサーを使用してください。いくつかの例がありますhere

0

HTMLを解析する場合は、Nokogiriを使用することを検討してください。

Nokogiri::HTML("<html>...</html>") 

またNokogiri::XMLを試すことができますが、私はそれが有効なマークアップを必要と考えています。

関連する問題