2009-03-19 16 views
0
xsltCopyText: text allocation failed 
runtime error: element value-of 
xsltValueOf: text copy failed 

XMLを解析する際にこのエラーが発生しました(実際にはwikipedia dump、XMLStarlet)。私はページタイトルとIDを得ることができますが、ページテキストになると失敗します。使用XMLStarlet:XML解析エラー

式:

xml sel -N xmlns=http://www.mediawiki.org/xml/export-0.3/ -T -t -m "//xmlns:revision" -v "xmlns:text" -n d:\wiki\translated.wiki.xml 

P.S.私はWindows上でそれをやっている。

答えて

2

translated.wiki.xmlの内容は何ですか?最初の数行を確認するだけで、どこかで壊れている可能性があります。

translated.wiki.xmlの小さなサブセットで問題を再現できますか?ウィキペディアのダンプは巨大なであり、あまりにも貪欲にメモリを割り当てるクラッシュツールです。

+0

私はXMLStarletを使ってtranslated.wiki.xmlを検証しました。それは一貫しています。 はい、小さなサブセットで正しく動作します。メモリの問題である必要があります。愚かな、愚かな私:) –

+0

さて、Xalan(XML Starletによって生成されたXSLT)を使用して問題を解決しました。 –