2012-04-15 13 views
2

lxmlとformalchemyを使用してsqlalchemy用のスキャフォールディングライブラリを構築していましたが、うまくプレイするのに苦労しています。具体的には、formalchemy.FieldSet.render()なしルートタグを含むHTMLの断片を返し、私は要素ツリーに含めることができる何かにそれを解析するためにlxmlのを取得する方法を見つけ出すように見えることはできません。ルートタグがないときにlxmlを解析するhtml

私は何を得る:

>>> lxml.etree.fromstring(formalchemy.FieldSet(toyschema.User(), session).render()) 
Traceback (most recent call last): 
    File "<stdin>", line 1, in <module> 
    File "lxml.etree.pyx", line 2743, in lxml.etree.fromstring (src/lxml/lxml.etree.c:52665) 
    File "parser.pxi", line 1573, in lxml.etree._parseMemoryDocument (src/lxml/lxml.etree.c:79932) 
    File "parser.pxi", line 1445, in lxml.etree._parseDoc (src/lxml/lxml.etree.c:78709) 
    File "parser.pxi", line 920, in lxml.etree._BaseParser._parseUnicodeDoc (src/lxml/lxml.etree.c:75083) 
    File "parser.pxi", line 564, in lxml.etree._ParserContext._handleParseResultDoc (src/lxml/lxml.etree.c:71739) 
    File "parser.pxi", line 645, in lxml.etree._handleParseResult (src/lxml/lxml.etree.c:72614) 
    File "parser.pxi", line 585, in lxml.etree._raiseParseError (src/lxml/lxml.etree.c:71955) 
lxml.etree.XMLSyntaxError: Extra content at the end of the document, line 8, column 1 
私が欲しいもの

>>> ?????(formalchemy.FieldSet(toyschema.User(), session).render()) 
[<Element div at 0x1e48e10>, <Element script at 0x1e48cd0>, <Element div at 0x1e48730>, <Element div at 0x1ea1e60>] 

マイ原油回避策:

>>> lxml.etree.fromstring('<root>%s</root>' % formalchemy.FieldSet(toyschema.User(), session).render()).getchildren() 
[<Element div at 0x1e48e10>, <Element script at 0x1e48cd0>, <Element div at 0x1e48730>, <Element div at 0x1ea1e60>] 

答えて

6

lxml.htmlを使用するHTMLを解析する場合、lxml.etreeではなく。

フラグメントのリストをdivにラップするのではなく、fragments_fromstring(string)のようにhereのように使用できます。

+0

まあ、それはもう少し近くになるようですが、条件付きで結果のツリーをdivまたはspanにラップします。しかし、改善を提案するために+1。 – SingleNegationElimination

+0

別の解析方法については、私の編集を参照してください。 – Acorn

関連する問題