Pythonで複数のルート要素を持つXMLファイルを解析し、そして私のようなデータを持っているいくつかの使用のために、それから、タグ、いくつかのフェッチする必要があります:私は解析する必要が私はxmlファイルを持っている
<?xml version="1.0"?>
<data>
<country name="Liechtenstein">
<rank>1</rank>
<year>2008</year>
<gdppc>141100</gdppc>
<neighbor name="Austria" direction="E"/>
<neighbor name="Switzerland" direction="W"/>
</country>
<country name="Singapore">
<rank>4</rank>
<year>2011</year>
<gdppc>59900</gdppc>
<neighbor name="Malaysia" direction="N"/>
</country>
<country name="Panama">
<rank>68</rank>
<year>2011</year>
<gdppc>13600</gdppc>
<neighbor name="Costa Rica" direction="W"/>
<neighbor name="Colombia" direction="E"/>
</country>
</data>
<?xml version="1.0"?>
<data>
<country name="Liechtenstein1">
<rank>1</rank>
<year>2008</year>
<gdppc>141100</gdppc>
<neighbor name="Austria1" direction="E"/>
<neighbor name="Switzerland1" direction="W"/>
</country>
<country name="Singapore">
<rank>4</rank>
<year>2011</year>
<gdppc>59900</gdppc>
<neighbor name="Malaysia1" direction="N"/>
</country>
<country name="Panama">
<rank>68</rank>
<year>2011</year>
<gdppc>13600</gdppc>
<neighbor name="Costa Rica" direction="W"/>
<neighbor name="Colombia" direction="E"/>
</country>
</data>
をこれは、私が使用:
ライン2でエラーを与えるこのコード:私はこれを解析する方法をxml.etree.ElementTree.ParseError: junk after document element:
私は、複数のXMLタグは、あなたが任意のアイデアを持っているので、これはと思い、?
は "私はxmlファイルを持っている..." いいえ、あなたしないでください。ファイルはどこから来たのですか?その側で問題を修正する可能性はありますか? (それを解析するのはあまり難しいことではありませんが、最初は無効なXMLを避ける方法があればそれが良いでしょう) – smarx
これは有効なXMLファイルではありません。しかし、あなたは '<?xml version =" 1.0 "?>'の前にそれを分割し、パーツを別々に解析することができます。 –
@smarx「可能性はありますか?」とはどういう意味ですか?私はファイルからサンプルデータのみを与えましたが、これにはさらに多くのルート要素が含まれています... @KlausD。より良いオプションを探します。 – ggupta