lxml

1熱

1答えて

私はNetBSD 7.1を実行しており、pipを使用してPythonのlxmlパッケージをインストールしようとしています。私はこのコンパイルエラーが発生しますが： # pip install lxml Collecting lxml Using cached lxml-3.8.0.tar.gz Installing collected packages: lxml Run

0熱

1答えて

Python Web Scraping：複数のタグを持つ1つの属性を抽出します。

オンラインブックマークサービスで自分のアカウントからデータをスクラップしようとしています。ブックマークのあるページは、次のように構成されています。 <!DOCTYPE html> <html lang="en"> <body> <div id="item1" class="outer_block"> <div class="title">Bookmark 1</div>

1熱

2答えて

lxmlとCDATAと＆

私はCDATAを持つXMLを持っており、その中にアンパサンドを持つURLを持つタグがあります。私はこれらのタグを読み取るためにlxmlを使用するはずですが、私はエラーが発生しています。 Traceback (most recent call last): File "<stdin>", line 1, in <module> File "src\lxml\lxml.etree.

0熱

2答えて

lxmlを使用すると、ネストされた要素内のテキストをどのように読み取ることができますか？

私はいくつかの特定のフレーズについて約500のXMLドキュメントを検索し、それらのフレーズのいずれかを含む要素のIDを出力しようとしています。現在、これは私のコードです：適切にこの意志の出力のような from lxml import etree import os import re files = os.listdir('C:/Users/Me/Desktop/xml') search

1熱

2答えて

xmlを使用してxmlをPythonで解析する（正しい方法が1つ）

Pythonでrequestモジュールを使用して応答を得ています。応答はxmlの形式です。私はそれを解析し、各 'dt'タグの詳細を取得したい。私はlxmlを使ってそれを行うことができません。ここでは、XML応答である： <?xml version="1.0" encoding="utf-8" ?> <entry_list version="1.0"> <entry id=

1熱

2答えて

適切なCSSセレクタを作成できません

問題はPythonのCSSセレクタに関するものです。 "最後"の項目を選択するための正しい方法でセレクタを書くことはできません。私は試してみました：その項目があり、その中 div.pager a:[text*='Last'] 要素： <div class="pager"><a href="/search/1080p/" class="current">1</a> <a href="/searc

3熱

1答えて

Pythonリクエストで時々空のリストが返される

"2005 - 2013"を "2005〜2013の間に飲みます" を掻き取ろうとしていましたが、最初はこのコードが私のために働いていましたが、私の要求はまだ import requests, lxml.html, csv headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36

0熱

1答えて

xpathツリーから要素を削除できません

xpathリストから要素を削除する際に問題があります。私はPythonで新人ですので、私はクマと一緒にくつろいでください。 nodes.getparent().remove(nodes)は要素を削除する必要がありますが、コンパイルすることはできません。これで、削除できる要素タイプが得られないようです。 nodes.getparent()に問題なく電話することはできますが、それを削除することはで

0熱

1答えて

サイトで認証が必要な場合、Pythonを使用してhtmlを取得するにはどうすればよいですか？

認証が必要ない場合、lxmlモジュールを使用してWebサイトのhtmlを取得できます。しかし、それが必要なときに、私はどのように 'ユーザー名'と 'パスワード'をPythonを使って入力するのですか？