hpricot

    4

    3答えて

    Rubyの学習を始めました。非常にクールな言語、それはたくさん好きです。 私は非常に便利なHpricot HTMLパーサーを使用しています。 私が探しているのは、HTMLタグを除いて、ページのすべてのテキストを取得することです。 例: 「これは私もしたい私がつかむしたいものです。 <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//

    2

    2答えて

    私はActiveResourceを使ってHTML文書のようなWebサービスを解析しようとしましたが、私は404エラーを受け取りました。 このタスクでは、ActiveResourceではなくXMLパーサーを使用する必要がありますか? おそらく、ActiveResourceは、別のRailsアプリケーションからデータを消費し、XMLデータをRailsモデルに簡単に変換できる場合にのみ便利です。たとえば

    9

    4答えて

    Ruby、Hpricot、Nokogiriを使用してHTMLタグを取り除く方法の例がたくさんありますが、すべてのHTMLを簡単かつ迅速に削除するinner_textメソッドがあります。 私がしようとしているのは、タグとその属性だけを残して、HTML文書からすべてのテキストを削除することです。 私はドキュメント設定inner_htmlをnilにループすると考えましたが、最初の要素(ルート)が文書の残

    1

    2答えて

    まあ、HpricotをLibxml-rubyに切り替えるのは速度が遅く、_whyが消えてしまったので、Nokogiriを一瞬見ていましたが、Libxml-rubyを見て速度と寿命を調べることにしました。私の基本的な何かが欠けているが、何イムがやろうとし機能していないされている必要があり、ここに私のXML列があります: <?xml version="1.0" encoding="utf-8" ?>

    0

    1答えて

    申し訳ありません、これは基本的な/愚かな/ noobの質問かもしれません - 私はちょうど微調整しようとしています既存のRubyスクリプト - 私のMac上で動作しますが、Ubuntu 9.04では動作しません。 エラーはこれです:ルビーのRSSビットを使用してRSSファイルを書き出すしようとしている /usr/lib/ruby/1.8/rss/rss.rb:922:in `have_requir

    3

    3答えて

    のデータがHTML形式で表示され、サーバーに送信されると、いくつかの前処理が行われます。 "img"タグの "src"属性で動作します。 前処理および保存後、前処理されたすべての「img」タグは自動で閉じられません。例えば "IMG" タグには、次のいた場合、: <img src="image.png" /> を鋸山やHpricotで前処理した後、それは次のようになります。 <img src=

    2

    3答えて

    ページ上の2つのcssクラスのページをスクラップするコードに取り組んでいます。私は単にので、このためのHpricotの検索方法を使用しています: webpage.search("body").search("div.first_class | div.second_class") ...各項目について、私はオブジェクトを作成し、配列にそれを置く見つけ、これは一つのことを除いて素晴らしい作品。

    6

    2答えて

    は定期的に私はこの例外を取得:このコード行に NotImplementedError: method `at' called on terminated object : next if Hpricot(html).at('a') このエラーは何を意味するのでしょうか?どうすればそれを避けることができますか?

    2

    1答えて

    私はRuby on Rails 2.3.8で作業しています。ユーザーが投稿するウェブサイトがあります。それぞれには、メインページに表示される簡単な説明があります。その説明はオリジナルから自動的に作成されますが、切り捨てられて最大240文字に達します。 問題には画像や動画が含まれている可能性があり、これらの文字列を切り捨てると表示されないようにすることは問題です。私は、HTMLを解析するHprico

    1

    2答えて

    hpricot gemのロードに問題があります。 私はそれをrakeタスクで使用し、require "hpricot"を入れています。 しかし、それはエラーメッセージでロードされません:no such file to load -- hpricot 私はそれを私の宝石リストに表示しますが、レーキタスクがそれを認識しない理由を知らないでしょう。 誰もがhpricot gemでこの種の問題を経験してい