まあ、HpricotをLibxml-rubyに切り替えるのは速度が遅く、_whyが消えてしまったので、Nokogiriを一瞬見ていましたが、Libxml-rubyを見て速度と寿命を調べることにしました。私の基本的な何かが欠けているが、何イムがやろうとし機能していないされている必要があり、ここに私のXML列があります:libxml-ruby構文解析ヘルプ
<?xml version="1.0" encoding="utf-8" ?>
<feed>
<title type="xhtml"></title>
<entry xmlns="http://www.w3.org/2005/Atom">
<id>urn:publicid:xx.xxx:xxxxxx</id>
<title>US--xxx-xxxxx</title>
<updated>2009-08-19T15:49:51.103Z</updated>
<published>2009-08-19T15:44:48Z</published>
<author>
<name>XX</name>
</author>
<rights>blehh</rights>
<content type="text/xml">
<nitf>
<head>
<docdata>
<doc-id regsrc="XX" />
<date.issue norm="20090819T154448Z" />
<ed-msg info="Eds:" />
<doc.rights owner="xx" agent="hxx" type="none" />
<doc.copyright holder="xx" year="2009" />
</docdata>
</head>
<body>
<body.head>
<hedline>
<hl1 id="headline">headline</hl1>
<hl2 id="originalHeadline">blah blah</hl2>
</hedline>
<byline>john doe<byttl>staffer</byttl></byline>
<distributor>xyz</distributor>
<dateline>
<location>foo</location>
</dateline>
</body.head>
<body.content>
<block id="Main">
story content here
</block>
</body.content>
<body.end />
</body>
</nitf>
</content>
</entry>
</feed>
完全飼料から約150、そのような項目があります。
私はちょうど150のエントリをループし、コンテンツと属性を取得したいのですが、libxml-rubyを使ってHpricotでうまく動作していました。
parser = XML::Parser.string(file)
doc = parser.parse
entries = doc.find('//entry')
puts entries.size
entries.each do |node|
puts node.inspect
end
任意のアイデア:
この小さなスニペットがイムもエントリを得ていないことを示して?私はドキュメントを見て、単純なXMLファイルを見つけることができませんでした。ここにx、y、zを得るサンプルがあります。これはかなりシンプルなはずです。
私はこのスレッドに戻るのを忘れましたが、はい、私は何か類似の錫をしました – initialized