hpricot

    12

    3答えて

    私は次のHTMLを持っています: <html> <body> <h1>Foo</h1> <p>The quick brown fox.</p> <h1>Bar</h1> <p>Jumps over the lazy dog.</p> </body> </html> ...そしてRubyGem Nokogiri(hpricot置換え)を使って、次のようにHTMLに変更したいと思いま

    1

    2答えて

    私は一定の基準(クラス=「int型」またはクラス=「EXT」)を満たしていないHTMLページ(実際にはTinyMCEはユーザー入力)からのすべての画像を削除したい と私は正しいアプローチでstruggelingよ。それは私がこれまでやってんだよ: hbody = Hpricot(input) @internal_images = hbody.search("//img[@class='int']

    5

    6答えて

    Webスクレイピングを含むかなり広範なプロジェクトを行う必要があり、HpricotやBeautiful Soup(RubyやPythonなど)の使用を検討しています。私は右足でプロジェクトを開始するのに役立つだろうと思っているチュートリアルに誰かが出会ったのですか?

    2

    5答えて

    私はhpricotでテーブルベースのウェブサイトからいくつかの情報を抽出しようとしています。私はFireBugでXPathを手に入れました。 /html/body/div/table/tbody/tr/td/table/tbody/tr[2]/td/table/tbody/tr/td[2]/table/tbody/tr[3]/td/table[3]/tbody/tr これは...どうやら、放火

    1

    2答えて

    私はWebサービスとレールで作業したことはありません。明らかにこれは私が学ぶ必要があるものです。 私はhpricotを使いたいと思っています。 とにかく、_whyはhpricot website上で、次の例を提供するのに十分良かったです:、シンプルでエレガントな、と簡単peaseyに見える #!ruby require 'hpricot' require 'open-uri' # load

    0

    1答えて

    私は、私のレールアプリでtwitterとflickrからXMLを取り出して操作しています。結果はすべてのページに表示され、解析はHpricotとopen-uriを使用してApplication Controllerで処理されます。 これはアクションキャッシングを使用した初めての実験で、動作していないようです。私はWEBRickを使って開発モードに入っています。適切なものはすべてdevelopmen