nokogiri

    0

    2答えて

    NokogiriでRails 4.2.7を使用しています。子ノードを作成できません。私は次のコード general = doc.xpath("//lomimscc:general") description = Nokogiri::XML::Node.new "lomimscc:description", doc string = Nokogiri::XML::Node.new "lomims

    1

    2答えて

    解析中のHTMLコードから文字列にパイプ区切り文字を追加するにはどうすればよいですか? HTML: <div class="container"> <div class="results"> <div class="row"> <div class="col"> <nav class="breadcrumb-nav"> <ol class=

    3

    2答えて

    私は誤っていくつかのライブラリを削除しました(私は思っていますが、どう思われるかは分かりません)。今では必要なバージョンのnokogiriをインストールできません。私は同様の問題を抱えた他の投稿を読んだので、その解決策は役に立たない。次のエラーを参照してください:( Gem::Ext::BuildError: ERROR: Failed to build gem native extension.

    2

    1答えて

    私は以下のようにHTML文書の本文からテキストを取得しています。 "Exhibit 99"という用語の正規表現スキャンを試みると、一致しない、つまり空の配列が得られます。しかし、htmlでは、 "Exhibit 99"が表示されますが、inspect要素には& nbsp99という文字が表示されます。これらのHTML文字を取り除き、 "Exhibit 99"を通常の文字列のように検索するにはどうすれ

    1

    2答えて

    Nokogiri xpath式でconcat()を使用するにはどうすればよいですか?私が試した: xml.xpath("concat(/root/a/text(), /root/b/text())") しかし、それはで失敗します。 ArgumentError: node_set must be a Nokogiri::XML::NodeSet 鋸山で始まるだけXPath式を受け入れるように実際

    3

    2答えて

    XPathセレクタを使用してページ上の各アイテム(約24)を選択し、各アイテムのXPathセレクタを使用して各アイテムから値を返します。 サブノードでXPathセレクタを実行していても、各サブノードに対して個別に実行したいすべてのサブノードを検索しているようです。 docの各アイテムを検索してから、それぞれhtml_listingを繰り返します。その後get_field_data_fromに渡し:

    1

    1答えて

    RailsアプリケーションでXMLファイル用のフォルダを探し、解析してデータベースに保存するRakeタスクがあります。コードは正常に動作しますが、私は約2100ファイルの合計が1.5GBで、処理は非常に遅く、約400時間のファイルが7時間です。各XMLファイルには約600〜650の契約があり、各契約は0〜n個の添付ファイルを持つことができます。私はすべての値を貼り付けませんでしたが、各契約は25の

    0

    2答えて

    私はオンに鋸山を使用しようとしていたのimgからすべての属性を抽出する方法: <img class="img-responsive" src="img/logologo.png" alt=""> へ: # a = <img class="img-responsive" src="img/logologo.png" alt="" width="256" height="256"> page =

    0

    1答えて

    私は自由な時間にノコギリで遊んでいましたが、私は本当にこだわってしまったのでしょうか?今朝(この8時間後にこの問題を解決しようとしています。 。それは私がpage.So上のすべてのスレッドをこすりしたいwebsiteではこれまで、私はすべてのスレッドの親が <div id="threads" class="extended-small"> は、各スレッドは、3つの要素で構成されていることを実感