lxml

    3

    1答えて

    lxmlのiterparseをHTMLに使用すると問題が発生しています。私は<title>のテキストを取得しようとしているが、このシンプルな機能は、完全なWebページ上では動作しません: def get_title(str): titleIter = etree.iterparse(StringIO(str), tag="title") try: for event

    -1

    1答えて

    私がしたいことは、このようなものです。私のページでは、私はこのタグ <p class="pretty"> Some text </p> を持つHTMLドキュメントを持っていると私はtag.attrib.pop('class')を使用してタグのクラスを取り除くことができ <blockquote> <p> Some Text </p> </blockquote>

    0

    1答えて

    このスクリプトをリンク名から "nmv-fas"を取得し、その名前のディレクトリを作成して、そのディレクトリにダウンロードされたすべてのファイルを配置するにはどうすればよいですか? all.html:という名前のフォルダに保存され <a href="http://www.youversion.com/bible/gen.45.nmv-fas">http://www.youversion.com/b

    0

    1答えて

    lxmlやmechanizerを使ってこのスクリプトの速度を向上させ、すべてのtogtherを美しいスープにカットする方法はありますか? のpython: <a href="http://www.youversion.com/bible/gen.1.nmv-fas">http://www.youversion.com/bible/gen.1.nmv-fas</a> <a href="http:

    3

    2答えて

    私はまだlxmlをインストールしています。 IDLEでうまく動作します。 しかし、私がdev_appserver.pyで以下に説明する基本的なアプリケーションを起動すると、サーバーはエラー "No module named lxml"を返します。 import webapp2,lxml class MainPage(webapp2.RequestHandler): def get(s

    5

    4答えて

    デフォルトでは、lxmlは長い単語で単語区切りを追加するために使用されるwbrタグには対応していません。これは、<wbr>という形式で、brタグと同様にフォーマットする必要がある場合は、<wbr></wbr>という形式になります。 lxmlにこの動作を追加するにはどうすればよいですか?

    -2

    1答えて

    ここではいくつかのコードです: from lxml import etree url = 'http://www.google.com/ig/api?stock=aapl' data = etree.parse(url) root = data.getroot() finance = root[0] def clean(var, num): var = str(financ

    0

    3答えて

    私はこの数時間、この問題に悩まされています。 これはXMLが <xmlblock> <data1> <username>someusername</username> <id>12345</id> </data1> <data2> <username>username</username> <id>11

    3

    2答えて

    lxmlを使ってHTMLページからすべてのURLとその名前を探したい。 私はこのURLを解析できますが、このことを知ることはできますが、lxmlを使用してすべてのURLリンクを見つけることができる簡単な方法はありますか?

    1

    1答えて

    私はURLで作業中です&特定のリンクを取得したいです。 が存在しますが、テーブルが多数あります。 lxmlを使用して1行または2行のコード内でどのように処理できますか?私は 表2.1金利のために優れてダウンロードしたい url = 'http://www.bnm.gov.my/index.php?ch=109&pg=294&mth=3&yr=2012&eId=box1' :銀行機関 私はテーブ