lxml

    11

    2答えて

    私はlxmlを使ってURLを与えられたhtmlファイルを解析しています。例えば : link = 'https://abc.com/def' htmltree = lxml.html.parse(link) 私のコードは、ほとんどの場合のためにうまく機能している、http://を持つもの。しかし、私はすべてのhttps://のURLを発見した、lxmlはIOErrorを取得します。誰もその理

    18

    1答えて

    lxmlのetreeを使用しているXMLファイルがありますが、タグを追加するとかなり印刷されません。 >>> from lxml import etree >>> root = etree.parse('file.xml').getroot() >>> print etree.tostring(root, pretty_print = True) <root> <x>

    1

    2答えて

    私はいくつかのhtmlを解析しようとしていますが、私はこの小さなhtmlコードでいくつか問題があります。 XML: <div> <p><span><a href="../url"></a></span></p> <h3 class="header"><a href="../url">Other</a></h3> <a href="../url">Other</a><b

    0

    1答えて

    私はウェブを解析して、今はトラフをナビゲートしたり、グラフを表示したりしたいと思います。 グラフを取得するにはどうすればよいですか?または、ツリーをナビゲートします。最初のステップを表示し、次に他のステップなどを示します。そして、木がどのように構築されたかを理解してください。 import urllib from lxml import etree import StringIO resul

    8

    2答えて

    *注:lxmlのは、私のシステム上で実行されません。私はlxmlに関係しない解決策を見つけることを望んでいました。 私はすでにこの辺りのドキュメントのいくつかを行っている、と私はしたいと思いますどのように動作するように、これを取得する難しさを持っています。この1に従うより「辞書」はありますが、私が操作しようとしているファイルで <dict> <key>1375</key> <d

    0

    1答えて

    私はしたい正確なトラバーサルタイプの名前はわかりませんが、基本的には、現在の要素と逆の順序で要素ごとにドキュメントを読みたいと思っています。 iterdescendants()メソッドは何もしていないようで、iterancestors()メソッドはサブ要素には入っていません。

    1

    1答えて

    xmlを解析するためにlxmlを使用しています。私はAmazonの商品広告APIから得ました。私はroot.tagまたはroot.child.tagを使用すると、私はいつものようなものを取得 root=etree.XML(self.sendRequest(parameters)) :リンクはタグ名に表示されます {http://webservices.amazon.com/AWSECommer

    3

    2答えて

    xmlドキュメントを作成するためにlxml "E-Factory"(別名ElementMaker)を使用しています。しかし、E-工場を使用して、私は「データ付加」要素でダッシュを指定するかどうかはわかりません <url> <date-added>2011-11-11</date-added> </url> :私はこれに似たXML文書を生成しようとしています。ダッシュをマイナス記号と

    2

    1答えて

    私はlxml iterparseを使用して巨大なxmlファイルを読み込みます。与えられたmainElementに対して、私は子要素をチェックし、各子を処理します。しかし、要素内の子を調べると、実際にパーサはいくつかの子ノードを実際には見逃していることに気付きます。私は各要素の長さを印刷しました。要素の長さは、要素タグの定数でなければなりませんが、時にはそれより小さくなります。そして、驚くべきことに

    3

    2答えて

    ストレートlxmlとPyQueryを使用した経験のある人はいませんか。私はちょうど後者に最近来て、興味をそそられました。私はまだライブラリについて多くのコメントを見つけることができていないので、それがどれほど堅牢であるか興味があります。 私はlxmlに精通しており、一般的にそれを楽しんでいます。しかし、jQueryのセレクタ構文を使用するといいでしょう。 スイッチの価値はありますか? ありがとうご