に未定義のメソッド「namespace_definitions」打撃をアップ解析し、私はこれを使用しています:私はそれを追跡してきた鋸山HTML私はHTMLフラグメントを解析し、クリーンアップするには鋸山の宝石のバージョン1.4.0</p> <p>を使用してHTMLを解析しているレールのアプリを持っている<o:p>タグ
NoMethodError: undefined method `namespace_definitions' for nil:NilClass
from .../nokogiri-1.4.0/lib/nokogiri/xml/fragment_handler.rb:33:in `start_element'
from .../nokogiri-1.4.0/lib/nokogiri/html/sax/parser.rb:34:in `parse_with'
from .../nokogiri-1.4.0/lib/nokogiri/html/sax/parser.rb:34:in `parse_memory'
from .../nokogiri-1.4.0/lib/nokogiri/xml/sax/parser.rb:83:in `parse'
from .../nokogiri-1.4.0/lib/nokogiri/xml/document_fragment.rb:7:in `initialize'
from .../nokogiri-1.4.0/lib/nokogiri/html/document_fragment.rb:9:in `new'
from .../nokogiri-1.4.0/lib/nokogiri/html/document_fragment.rb:9:in `parse'
:私はこのエラーを取得してい
Nokogiri::HTML::DocumentFragment.parse(text).to_html
私は解析するhpricotを使用しているときに働いている、特定の入力を解析しようとすると、私が得たものは、MS Officeが段落区切りにタグを付けるために使用するものです。
<p class="MsoNormal"><span style="font-family:"Arial","sans-serif""><o:p></o:p></span></p>
ノコギリがこのタグに爆発しないようにする方法はありますか?理想的には、可能ならば、hpricotのようにタグを変えずに残しておきたいです。そうでなければ、少なくともタグをはがすことはエラーを投げるよりも良いでしょう。
ノコギリの宝飾品をアップグレードして解決しました – keithepley