2011-06-22 6 views
2

に未定義のメソッド「namespace_definitions」打撃をアップ解析し、私はこれを使用しています:私はそれを追跡してきた鋸山HTML私はHTMLフラグメントを解析し、クリーンアップするには鋸山の宝石のバージョン1.4.0</p> <p>を使用してHTMLを解析しているレールのアプリを持っている<o:p>タグ

NoMethodError: undefined method `namespace_definitions' for nil:NilClass 
    from .../nokogiri-1.4.0/lib/nokogiri/xml/fragment_handler.rb:33:in `start_element' 
    from .../nokogiri-1.4.0/lib/nokogiri/html/sax/parser.rb:34:in `parse_with' 
    from .../nokogiri-1.4.0/lib/nokogiri/html/sax/parser.rb:34:in `parse_memory' 
    from .../nokogiri-1.4.0/lib/nokogiri/xml/sax/parser.rb:83:in `parse' 
    from .../nokogiri-1.4.0/lib/nokogiri/xml/document_fragment.rb:7:in `initialize' 
    from .../nokogiri-1.4.0/lib/nokogiri/html/document_fragment.rb:9:in `new' 
    from .../nokogiri-1.4.0/lib/nokogiri/html/document_fragment.rb:9:in `parse' 

:私はこのエラーを取得してい

Nokogiri::HTML::DocumentFragment.parse(text).to_html 

私は解析するhpricotを使用しているときに働いている、特定の入力を解析しようとすると、私が得たものは、MS Officeが段落区切りにタグを付けるために使用するものです。

<p class="MsoNormal"><span style="font-family:&quot;Arial&quot;,&quot;sans-serif&quot;"><o:p></o:p></span></p> 

ノコギリがこのタグに爆発しないようにする方法はありますか?理想的には、可能ならば、hpricotのようにタグを変えずに残しておきたいです。そうでなければ、少なくともタグをはがすことはエラーを投げるよりも良いでしょう。

+0

ノコギリの宝飾品をアップグレードして解決しました – keithepley

答えて

4

Nokogiri 1.4.0でこの問題が発生しました。 Nokogiri> = 1.4.1は、名前空間定義の問題を解決します。

+0

他の誰かが同じ問題を抱えている場合 – keithepley

関連する問題