私の場合、どの方法が最善かをXMLファイルで解析する必要があります。 beautifulsoup4、ElementTreeなどかなり大きなファイルです。 私は窓10の64ビット実行しているのpython 2.7.11 32ビットPython parse xmlファイル
xmlファイルがあります:英語:それは「LANG =をするdiv XML」を使用して異なる言語が含まれています、私はファイルをXMLからこの出力を取得しようとしている http://pastebin.com/jTDRwCZr
を"" for英語。これを達成するためにlxmlでbeautifulsoupをどのように使うことができるかについての助け?御時間ありがとうございます。
<tt xmlns="http://www.w3.org/2006/04/ttaf1" xmlns:tts="http://www.w3.org/2006/04/ttaf1#styling">
<head>
<styling>
<style id="1" tts:textOutline='#000000 2px 2px' tts:color="white"/>
</styling>
</head>
<body>
<div xml:lang="English">
<p begin="00:00:28.966" end="00:00:31.385" style="1">
text text text...
</p>
</div>
</body>
</tt>
lxmlのBeautifulSoupはほとんど決して悪い選択ではありません。 – Borealid
あなたが望むものは明確ではありません。あなたはちょうど英語のdivを取得し、他の言語を無視しようとしていますか? – mhawke
@mhawkeええ、それは私がそれをうまく説明してくれなかったことを申し訳なく思っています。英語のdivを取得して残りの部分を無視しようとしています。 – Yami