lxml

    1

    1答えて

    私はNetBSD 7.1を実行しており、pipを使用してPythonのlxmlパッケージをインストールしようとしています。 私はこのコンパイルエラーが発生しますが: # pip install lxml Collecting lxml Using cached lxml-3.8.0.tar.gz Installing collected packages: lxml Run

    0

    1答えて

    オンラインブックマークサービスで自分のアカウントからデータをスクラップしようとしています。ブックマークのあるページは、次のように構成されています。 <!DOCTYPE html> <html lang="en"> <body> <div id="item1" class="outer_block"> <div class="title">Bookmark 1</div>

    1

    2答えて

    私はCDATAを持つXMLを持っており、その中にアンパサンドを持つURLを持つタグがあります。私はこれらのタグを読み取るためにlxmlを使用するはずですが、私はエラーが発生しています。 Traceback (most recent call last): File "<stdin>", line 1, in <module> File "src\lxml\lxml.etree.

    0

    2答えて

    私はいくつかの特定のフレーズについて約500のXMLドキュメントを検索し、それらのフレーズのいずれかを含む要素のIDを出力しようとしています。現在、これは私のコードです:適切にこの意志の出力のような from lxml import etree import os import re files = os.listdir('C:/Users/Me/Desktop/xml') search

    1

    2答えて

    Pythonでrequestモジュールを使用して応答を得ています。応答はxmlの形式です。私はそれを解析し、各 'dt'タグの詳細を取得したい。私はlxmlを使ってそれを行うことができません。ここで は、XML応答である: <?xml version="1.0" encoding="utf-8" ?> <entry_list version="1.0"> <entry id=

    1

    2答えて

    問題はPythonのCSSセレクタに関するものです。 "最後"の項目を選択するための正しい方法でセレクタを書くことはできません。私は試してみました:その項目があり、その中 div.pager a:[text*='Last'] 要素: <div class="pager"><a href="/search/1080p/" class="current">1</a> <a href="/searc

    3

    1答えて

    "2005 - 2013"を "2005〜2013の間に飲みます" を掻き取ろうとしていましたが、最初はこのコードが私のために働いていましたが、私の要求はまだ import requests, lxml.html, csv headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36

    0

    1答えて

    xpathリストから要素を削除する際に問題があります。 私はPythonで新人ですので、私はクマと一緒にくつろいでください。 nodes.getparent().remove(nodes)は要素を削除する必要がありますが、コンパイルすることはできません。 これで、削除できる要素タイプが得られないようです。 nodes.getparent()に問題なく電話することはできますが、それを削除することはで

    0

    1答えて

    認証が必要ない場合、lxmlモジュールを使用してWebサイトのhtmlを取得できます。しかし、それが必要なときに、私はどのように 'ユーザー名'と 'パスワード'をPythonを使って入力するのですか?