2017-03-20 13 views
0

私はXMLを解析するためにlxmlのを使用しようが、私は問題を抱えている: とValueError:無効な\ Xここで を脱出は私のコードです:xmlをローカルファイルまたはurlからlxmlで解析する方法は?

from lxml import etree 
root=etree.fromstring('C:\Users\hptphuong\Desktop\xmltest.xml') 

私はlxmlの上の初心者です。この問題を解決するのを手伝ってください。 私のXMLコンテンツ

<?xml version="1.0"?> 
<catalog> 
    <book id="bk101"> 
     <author>Gambardella, Matthew</author> 
     <title>XML Developer's Guide</title> 
     <genre>Computer</genre> 
     <price>44.95</price> 
     <publish_date>2000-10-01</publish_date> 
     <description>An in-depth look at creating applications 
     with XML.</description> 
    </book> 
    <book id="bk102"> 
     <author>Ralls, Kim</author> 
     <title>Midnight Rain</title> 
     <genre>Fantasy</genre> 
     <price>5.95</price> 
     <publish_date>2000-12-16</publish_date> 
     <description>A former architect battles corporate zombies, 
     an evil sorceress, and her own childhood to become queen 
     of the world.</description> 
    </book> 
    <book id="bk103"> 
     <author>Corets, Eva</author> 
     <title>Maeve Ascendant</title> 
     <genre>Fantasy</genre> 
     <price>5.95</price> 
     <publish_date>2000-11-17</publish_date> 
     <description>After the collapse of a nanotechnology 
     society in England, the young survivors lay the 
     foundation for a new society.</description> 
    </book> 
    <book id="bk104"> 
     <author>Corets, Eva</author> 
     <title>Oberon's Legacy</title> 
     <genre>Fantasy</genre> 
     <price>5.95</price> 
     <publish_date>2001-03-10</publish_date> 
     <description>In post-apocalypse England, the mysterious 
     agent known only as Oberon helps to create a new life 
     for the inhabitants of London. Sequel to Maeve 
     Ascendant.</description> 
    </book> 
    <book id="bk105"> 
     <author>Corets, Eva</author> 
     <title>The Sundered Grail</title> 
     <genre>Fantasy</genre> 
     <price>5.95</price> 
     <publish_date>2001-09-10</publish_date> 
     <description>The two daughters of Maeve, half-sisters, 
     battle one another for control of England. Sequel to 
     Oberon's Legacy.</description> 
    </book> 
    <book id="bk106"> 
     <author>Randall, Cynthia</author> 
     <title>Lover Birds</title> 
     <genre>Romance</genre> 
     <price>4.95</price> 
     <publish_date>2000-09-02</publish_date> 
     <description>When Carla meets Paul at an ornithology 
     conference, tempers fly as feathers get ruffled.</description> 
    </book> 
    <book id="bk107"> 
     <author>Thurman, Paula</author> 
     <title>Splish Splash</title> 
     <genre>Romance</genre> 
     <price>4.95</price> 
     <publish_date>2000-11-02</publish_date> 
     <description>A deep sea diver finds true love twenty 
     thousand leagues beneath the sea.</description> 
    </book> 
    <book id="bk108"> 
     <author>Knorr, Stefan</author> 
     <title>Creepy Crawlies</title> 
     <genre>Horror</genre> 
     <price>4.95</price> 
     <publish_date>2000-12-06</publish_date> 
     <description>An anthology of horror stories about roaches, 
     centipedes, scorpions and other insects.</description> 
    </book> 
    <book id="bk109"> 
     <author>Kress, Peter</author> 
     <title>Paradox Lost</title> 
     <genre>Science Fiction</genre> 
     <price>6.95</price> 
     <publish_date>2000-11-02</publish_date> 
     <description>After an inadvertant trip through a Heisenberg 
     Uncertainty Device, James Salway discovers the problems 
     of being quantum.</description> 
    </book> 
    <book id="bk110"> 
     <author>O'Brien, Tim</author> 
     <title>Microsoft .NET: The Programming Bible</title> 
     <genre>Computer</genre> 
     <price>36.95</price> 
     <publish_date>2000-12-09</publish_date> 
     <description>Microsoft's .NET initiative is explored in 
     detail in this deep programmer's reference.</description> 
    </book> 
    <book id="bk111"> 
     <author>O'Brien, Tim</author> 
     <title>MSXML3: A Comprehensive Guide</title> 
     <genre>Computer</genre> 
     <price>36.95</price> 
     <publish_date>2000-12-01</publish_date> 
     <description>The Microsoft MSXML3 parser is covered in 
     detail, with attention to XML DOM interfaces, XSLT processing, 
     SAX and more.</description> 
    </book> 
    <book id="bk112"> 
     <author>Galos, Mike</author> 
     <title>Visual Studio 7: A Comprehensive Guide</title> 
     <genre>Computer</genre> 
     <price>49.95</price> 
     <publish_date>2001-04-16</publish_date> 
     <description>Microsoft Visual Studio 7 is explored in depth, 
     looking at how Visual Basic, Visual C++, C#, and ASP+ are 
     integrated into a comprehensive development 
     environment.</description> 
    </book> 
</catalog> 

つ以上があり、我々はlxmlのと、URLから解析XMLを持つことができます。

おかげ&敬具、

+0

を使用すると、XMLファイルを添付してくださいすることができますか? –

+0

lxmlのドキュメントを読んでください。あなたの質問に答えがあります。 – Tomalak

答えて

0

エラーメッセージinvalid \x escapeを得ている理由を動作するはずのファイル名の前にRを入れてみてくださいあなたが使用していることですetree.fromstring()を使用してファイルからXMLをロードしようとしました。この関数は、文字列から直接XMLをロードするために使用され、\のパスを渡しています。

from lxml import etree 

root = etree.parse(r'C:\Users\hptphuong\Desktop\xmltest.xml') 
# Print the loaded XML 
print etree.tostring(root) 

Pythonの関数にファイルパスを渡し、あなたは、通常のPythonをしないように伝えるためにrであなたの文字列の前に付ける必要があります。

は、次のようにetree.parse()機能を使用する必要があり、ファイルからXMLをロードするにはパス内にある\文字をエスケープしてください。たとえば、c:\tempは、実際にはc:<tab character>empを渡します。つまり、\tがタブ文字に変換されます。開始にrを追加すると、これが停止します。次のように

別の方法としては、パスを渡すことができます:

path = "c:\\folder1\\folder2\\myfile.xml" 
+0

さらに、スラッシュを使用することもできます: 'etree.parse( 'C:/Users/hptphuong/Desktop/xmltest.xml')'。 – mzjn

0

root = etree.fromstring(r"C:\Users\hptphuong\Desktop\xmltest.xml") 

それは

+0

私の答えはなぜ低下したのですか?私が作った提案も後にマーティンによって作られています。 –

関連する問題