elementtree

    11

    3答えて

    LXMLのetreeで生成しているXML文書にdoctypesを追加したいと思います。 しかし、私はdoctypeを追加する方法を理解できません。文字列のハードコーディングと連結はオプションではありません。 私は、PIのがetreeに追加されたかの線に沿って何か期待していた: pi = etree.PI(...) doc.addprevious(pi) をしかし、それは私のために働いていませ

    2

    1答えて

    私はテキストの文字列を取得しようとしており、段落/文書内の残りのテキストをhtmlから "抽出"しています。 私の現在のアプローチは、lxmlで解析されたhtml内の文字列の「親タグ」を見つけることです。 たとえば、「TEXT STRING HERE」というツリーを検索して「p」タグを戻します(この問題を解決するには、より良い方法を知っていればすべて耳にします)。 (私は事前にhtmlの正確なレイ

    5

    2答えて

    私はPythonのElementTreeを使ってXHTMLファイルを生成しようとしています。 ただし、ElementTree.Element()では単一のタグ(HTMLなど)を作成できます。 さまざまなDOCTYPESなどを配置できるように、何らかの仮想ルートを作成する必要があります。 どうすればよいですか?もっと良い方法があるかどうかはわからないが、私はこれが行わ見てきました おかげ

    1

    2答えて

    XMLファイルを解析し、データからレコードベースの出力を構築する必要があります。問題は、XMLがある種のデータ構造を表すいくつかのレベルのネストされた「ノード」要素を持つという点で、XMLが「汎用」形式であることです。私はレコードを "ノード"要素の最も深いレベルに基づいて動的に構築する必要があります。 XMLと期待される出力の例が一番下にあります。 私はPythonのElementTreeに最も