lxml

3熱

1答えて

lxmlのiterparseをHTMLに使用すると問題が発生しています。私は<title>のテキストを取得しようとしているが、このシンプルな機能は、完全なWebページ上では動作しません： def get_title(str): titleIter = etree.iterparse(StringIO(str), tag="title") try: for event

-1熱

1答えて

Pythonでlxmlを使用してhtml要素を別のタグで囲む方法

私がしたいことは、このようなものです。私のページでは、私はこのタグ Some text を持つHTMLドキュメントを持っていると私はtag.attrib.pop('class')を使用してタグのクラスを取り除くことができ <blockquote> Some Text </blockquote>

0熱

1答えて

pythonでフォルダを作成

このスクリプトをリンク名から "nmv-fas"を取得し、その名前のディレクトリを作成して、そのディレクトリにダウンロードされたすべてのファイルを配置するにはどうすればよいですか？ all.html：という名前のフォルダに保存され <a href="http://www.youversion.com/bible/gen.45.nmv-fas">http://www.youversion.com/b

0熱

1答えて

Pythonリンクダウンローダー

lxmlやmechanizerを使ってこのスクリプトの速度を向上させ、すべてのtogtherを美しいスープにカットする方法はありますか？のpython： <a href="http://www.youversion.com/bible/gen.1.nmv-fas">http://www.youversion.com/bible/gen.1.nmv-fas</a> <a href="http:

3熱

2答えて

dev_appserver（gae、windows）でpython lxmlを利用できません

私はまだlxmlをインストールしています。 IDLEでうまく動作します。しかし、私がdev_appserver.pyで以下に説明する基本的なアプリケーションを起動すると、サーバーはエラー "No module named lxml"を返します。 import webapp2,lxml class MainPage(webapp2.RequestHandler): def get(s

5熱

4答えて

lxmlとタグ

デフォルトでは、lxmlは長い単語で単語区切りを追加するために使用されるwbrタグには対応していません。これは、という形式で、brタグと同様にフォーマットする必要がある場合は、という形式になります。 lxmlにこの動作を追加するにはどうすればよいですか？

-2熱

1答えて

lxmlの - クリーンオブジェクトを返す関数だけではなく、文字列

ここではいくつかのコードです： from lxml import etree url = 'http://www.google.com/ig/api?stock=aapl' data = etree.parse(url) root = data.getroot() finance = root[0] def clean(var, num): var = str(financ

0熱

3答えて

Pythonを使用して2つの異なる基準でXMLツリーを検索するにはどうすればよいですか？

私はこの数時間、この問題に悩まされています。これはXMLが <xmlblock> <data1> <username>someusername</username> <id>12345</id> </data1> <data2> <username>username</username> <id>11

3熱

2答えて

lxmlを使ってHTMLのすべてのリンクを取得する

lxmlを使ってHTMLページからすべてのURLとその名前を探したい。私はこのURLを解析できますが、このことを知ることはできますが、lxmlを使用してすべてのURLリンクを見つけることができる簡単な方法はありますか？

1熱

1答えて

lxmlを使用してURLを取得するためのcssselectの使用

私はURLで作業中です&特定のリンクを取得したいです。が存在しますが、テーブルが多数あります。 lxmlを使用して1行または2行のコード内でどのように処理できますか？私は表2.1金利のために優れてダウンロードしたい url = 'http://www.bnm.gov.my/index.php?ch=109&pg=294&mth=3&yr=2012&eId=box1' ：銀行機関私はテーブ