lxml

0熱

1答えて

ウェブサイトから大きなHTMLテキストを解析したい。だから私は事業部を解析されており、今、私は例えば、タグ内のコンテンツをしたい： [<Element div at 0x29c4be2fa98>] ：今patch_messageは私を与えるため patchpage = requests.get(href) tree = html.fromstring(patchpage.cont

1熱

1答えて

lxml.etree._ElementTreeのリストをファイルに保存するには

私はlxmlライブラリの厄介な問題に遭遇しており、回避方法を理解できません。私はリストに保存されているcorospondingパスと呼ばれるパス element_found = [True if len(tree.xpath(path)) > 0 else False for tree,path in zip(trees,paths)] print(element_found.count(Fa

0熱

1答えて

lxmlでイタリック体とイタリック体のテキストを取得する方法

私はテーブルの各行に対してこのコマンドを使用していますが、イタリック体ではないテキストのみを取得しています。 name = ''.join(row.xpath('td[3]/a/text()')) a要素は<em> </emタグ内のテキストを持っています。 <td class="cardname"><a href="http://www.mtgotraders.com/store/PRM_Ba

1熱

1答えて

ElementMakerで要素に属性を追加するにはどうすればよいですか？

私は以下のようにXMLを生成する必要が、 <?xml version='1.0' encoding='UTF-8' standalone='yes'?> <serviceConfiguration xmlns="http://blah.com/serviceConfiguration"> <node name="node1"> <hostName>host1</hostNa

1熱

1答えて

xml-offをノードで解析する

Yahooファイナンスページから値を解析しようとしています。私は興味の要素（株式の現在の価格を）検査するChromeを使用して、この簡単なスクリプトでXPathを使用： from lxml import html import requests page = requests.get('https://finance.yahoo.com/quote/VNQ?p=VNQ') tree = h

1熱

1答えて

Pythons lxml text（）の引数を使用するときにテキストデータにURLを含める方法

私は、lxmlライブラリを使用して、収集したHTMLデータを解析しようとしています。ほとんどの場合、必要な値を抽出して成功した結果が得られましたが、私のコードではテキストデータの中にあるURLが抽出されないようです。以下のコードは、私が難しかった特定の値の単なる一例です。いくつかの値は文字だけで表示され、他の文字は文字で表示されます。 text（）引数の代わりに、URLのテキストが含まれていますか

0熱

2答えて

lxmlでPubmed API xmlを解析し、辞書に子をつけて

私はスキルが不足しているので、私はPythonを再学習しようとしています。私は現在Pubmed APIを使っています。 hereというXMLファイルを解析して、各子（ '/ pubmedarticle'）を通過するループを実行し、いくつかの物を取得します。記事タイトルの場合は、 pubmedidのキー（pmid）。出力すなわちは、次のようになります。今、私はちょうど私が欲しいデータを取得するため

0熱

1答えて

XMLを解析するときに余分な要素内にネストされたテキストを取得する

XMLファイル（リポジトリのxmlファイル）にある詩の行をテキストファイル（以下のレポにtxtファイル）各行は "l"タグで囲まれています。問題は、これらの行のうち3行に、迷惑な "マイルストーン"要素があり、新しいファイルに書き込むときに自分のコード（pyファイル）がその行を無視するということです。誰も助けることができますか？具体的には、私が何かしたい： <l>τίς τ᾽ ἄρ σφωε θ

0熱

1答えて

不正な形式のHTMLを処理します（終了タグなし）

私はlxmlパーサを介してHTMLを解析するのにBeautifulSoupを使用します。 <table>タグが適切に閉じられているものの <table id='reportTable' class='report-table' style='width:auto' cellspacing='0'><tr> <th>Номер<br>поезда<th>Дата<br>отправления<th

0熱

1答えて

lxmlを使用して、親要素をその子タグとともに新しいetreeに追加します。

簡単な質問です。申し訳ありませんが、基本的な場合は、私はグーグルを試みたが、有用な何かを得ていない。ここに私の質問です。 <?xml version="1.0" encoding="UTF-8"?> <parent> <child c="1"> <e1>abc</e1> <e2>abc</e2> <e3>abc</e3> <e4>