PythonのXMLツリーの下位要素からすべてのテキストを抽出します

私は政府の請求書データのセクションを抽出しようとしています（https://www.govtrack.us/data/congress/113/bills/sconres/sconres14/text-versions/is/document.xmlなど）。セクションのテキストだけが必要ですが、pythonのxml.etree.ElementTreeを使ってどのようにナビゲートするかを理解することはできません。同等のjavascriptはgetElementbyTagNameのようなものになります。PythonのXMLツリーの下位要素からすべてのテキストを抽出します

出典

2016-04-17 Dan Jenson

xml.etree.ElementTreeには、XPath expression文字列をパラメータとして渡して、特定の基準を持つ要素を見つけることができます。したがって、単純な要素名（接頭辞を含まない要素名）の場合、ElementTreeにあるJavascriptのgetElementbyTagName("elementName")に相当するものはfindall(".//tagName")となります。

出典

2016-04-17 10:39:33 har07

PythonのXMLツリーの下位要素からすべてのテキストを抽出します

答えて

関連する問題