私は政府の請求書データのセクションを抽出しようとしています(https://www.govtrack.us/data/congress/113/bills/sconres/sconres14/text-versions/is/document.xmlなど)。セクションのテキストだけが必要ですが、pythonのxml.etree.ElementTreeを使ってどのようにナビゲートするかを理解することはできません。同等のjavascriptはgetElementbyTagNameのようなものになります。PythonのXMLツリーの下位要素からすべてのテキストを抽出します
0
A
答えて
1
xml.etree.ElementTree
には、XPath expression文字列をパラメータとして渡して、特定の基準を持つ要素を見つけることができます。したがって、単純な要素名(接頭辞を含まない要素名)の場合、ElementTree
にあるJavascriptのgetElementbyTagName("elementName")
に相当するものはfindall(".//tagName")
となります。
関連する問題
- 1. トップレベル要素ツリーXML要素からデータを抽出する方法は?
- 2. 入力クラス内の要素からテキストを抽出します
- 3. Python minidomはXMLからテキストを抽出します
- 4. リスト内の「下位」/「端末」要素を抽出するR
- 5. python要素ツリーの抽出値が機能しない
- 6. XmlDocumentからXML要素を抽出します。
- 7. Python - 要素ツリーがXML宣言を削除しています
- 8. Pythonのページからすべてのリンクを抽出します。
- 9. すべてのフォーム要素を抽出します。名前htmlagilitypack
- 10. 要素ツリーは空のテキストを出力します
- 11. Python 3のノード属性に基づくXML要素テキストの抽出
- 12. Selenium(Python):テキストからすべてのWeb要素を削除します。
- 13. XMLファイルからテキストを抽出する
- 14. 要素ツリーxml
- 15. 要素のすべての下位要素を反復する方法
- 16. BeautifulSoupを使用してspan要素のテキストを抽出する
- 17. XMLからの要素名とプロパティ値の抽出
- 18. リストから特定の要素を抽出するpython 2.7
- 19. ツリーを構築してすべてのブランチを抽出する
- 20. Pythonの - 要素ツリー
- 21. 出力構文解析ツリーからテキストを抽出する
- 22. PHPでXML要素を抽出する
- 23. Pythonのセレンどのように抽出テキスト要素の後
- 24. PDFから文字列の位置を含むすべてのテキストを抽出します
- 25. BeautifulSoupタグ要素からのテキストの抽出
- 26. python要素ツリーを使用してxmlからExcelシートにサブテーブルを作成
- 27. postgresqlのステートメントから最初の要素を抽出します
- 28. 同じタグの要素を抽出してXMLから地図を作成
- 29. VBA内のパワーポイントファイルからすべてのテキストを抽出
- 30. Tensorflow:他のすべての要素を抽出する