解析CDATAのpython

とXMLで私は、後にプロットするために保持する必要があるCDATAのブロック数を持つXMLファイルを解析する必要があります：私は繰り返し迅速にこれを行う必要があります解析CDATAのpython

<process id="process1"> <log name="name1" device="device1"><![CDATA[timestamp value]]]></log> <log name="name2" device="device2"><![CDATA[timestamp value, timestamp value, timestamp]]]></log> </process>

を私はこれを行う最善の方法を探しています。私はElementTreeがメソッドのほうが速いことを読んだが、私は他の提案にも触れている。

出典

2012-12-04 Jen

xtreeは、問題の要素ツリーよりも優れた代替方法です。 – Rajendra

は、ここでそれを行う方法の2つの例です：

from lxml import etree 
import xml.etree.ElementTree as ElementTree 

CONTENT = """ 
<process id="process1"> 
<log name="name1" device="device1"><![CDATA[timestamp value]]></log> 
<log name="name2" device="device2"><![CDATA[timestamp value, timestamp value, timestamp]]></log> 
</process> 
""" 

def parse_with_lxml(): 
    root = etree.fromstring(CONTENT) 
    for log in root.xpath("//log"): 
     print log.text 

def parse_with_stdlib(): 
    root = ElementTree.fromstring(CONTENT) 
    for log in root.iter('log'): 
     print log.text 

if __name__ == '__main__': 
    parse_with_lxml() 
    parse_with_stdlib()

出力：

timestamp value 
timestamp value, timestamp value, timestamp 
timestamp value 
timestamp value, timestamp value, timestamp

テキストは、それは両方のケースでそれを扱う属性。

出典

2013-01-21 03:22:55 Joe

パフォーマンスのために、 'cElementTree'を使うことができました（注：leadind' c'） – jfs

答えて

関連する問題