lxml

    0

    1答えて

    ウェブサイトから大きなHTMLテキストを解析したい。 だから私は事業部を解析されており、今、私は例えば、タグ内のコンテンツをしたい: [<Element div at 0x29c4be2fa98>] :今patch_messageは私を与えるため patchpage = requests.get(href) tree = html.fromstring(patchpage.cont

    1

    1答えて

    私はlxmlライブラリの厄介な問題に遭遇しており、回避方法を理解できません。 私はリストに保存されているcorospondingパスと呼ばれるパス element_found = [True if len(tree.xpath(path)) > 0 else False for tree,path in zip(trees,paths)] print(element_found.count(Fa

    0

    1答えて

    私はテーブルの各行に対してこのコマンドを使用していますが、イタリック体ではないテキストのみを取得しています。 name = ''.join(row.xpath('td[3]/a/text()')) a要素は<em> </emタグ内のテキストを持っています。 <td class="cardname"><a href="http://www.mtgotraders.com/store/PRM_Ba

    1

    1答えて

    私は以下のようにXMLを生成する必要が 、 <?xml version='1.0' encoding='UTF-8' standalone='yes'?> <serviceConfiguration xmlns="http://blah.com/serviceConfiguration"> <node name="node1"> <hostName>host1</hostNa

    1

    1答えて

    Yahooファイナンスページから値を解析しようとしています。私は興味の要素(株式の現在の価格を)検査するChromeを使用して、この簡単なスクリプトでXPathを使用: from lxml import html import requests page = requests.get('https://finance.yahoo.com/quote/VNQ?p=VNQ') tree = h

    1

    1答えて

    私は、lxmlライブラリを使用して、収集したHTMLデータを解析しようとしています。ほとんどの場合、必要な値を抽出して成功した結果が得られましたが、私のコードではテキストデータの中にあるURLが抽出されないようです。以下のコードは、私が難しかった特定の値の単なる一例です。いくつかの値は文字だけで表示され、他の文字は文字で表示されます。 text()引数の代わりに、URLのテキストが含まれていますか

    0

    2答えて

    私はスキルが不足しているので、私はPythonを再学習しようとしています。私は現在Pubmed APIを使っています。 hereというXMLファイルを解析して、各子( '/ pubmedarticle')を通過するループを実行し、いくつかの物を取得します。記事タイトルの場合は、 pubmedidのキー(pmid)。出力すなわち は、次のようになります。今、私はちょうど私が欲しいデータを取得するため

    0

    1答えて

    XMLファイル(リポジトリのxmlファイル)にある詩の行をテキストファイル(以下のレポにtxtファイル)各行は "l"タグで囲まれています。問題は、これらの行のうち3行に、迷惑な "マイルストーン"要素があり、新しいファイルに書き込むときに自分のコード(pyファイル)がその行を無視するということです。誰も助けることができますか? 具体的には、私が何かしたい: <l>τίς τ᾽ ἄρ σφωε θ

    0

    1答えて

    私はlxmlパーサを介してHTMLを解析するのにBeautifulSoupを使用します。 <table>タグが適切に閉じられているものの <table id='reportTable' class='report-table' style='width:auto' cellspacing='0'><tr> <th>Номер<br>поезда<th>Дата<br>отправления<th

    0

    1答えて

    簡単な質問です。申し訳ありませんが、基本的な場合は、私はグーグルを試みたが、有用な何かを得ていない。ここに私の質問です。 <?xml version="1.0" encoding="UTF-8"?> <parent> <child c="1"> <e1>abc</e1> <e2>abc</e2> <e3>abc</e3> <e4>