2016-04-17 22 views
0

私は政府の請求書データのセクションを抽出しようとしています(https://www.govtrack.us/data/congress/113/bills/sconres/sconres14/text-versions/is/document.xmlなど)。セクションのテキストだけが必要ですが、pythonのxml.etree.ElementTreeを使ってどのようにナビゲートするかを理解することはできません。同等のjavascriptはgetElementbyTagNameのようなものになります。PythonのXMLツリーの下位要素からすべてのテキストを抽出します

答えて

1

xml.etree.ElementTreeには、XPath expression文字列をパラメータとして渡して、特定の基準を持つ要素を見つけることができます。したがって、単純な要素名(接頭辞を含まない要素名)の場合、ElementTreeにあるJavascriptのgetElementbyTagName("elementName")に相当するものはfindall(".//tagName")となります。

関連する問題