0
を使用してスパンを含むdiv要素内のテキストを取得し、私はこのような一部のHTMLがあります。のXPath
<div id="uniqueID">here <span>is some</span> text</div>
私が取得したいのですが、私は
$("#uniqueID").text()
# returns "here is some text"
を使用することができますjQueryを使ってのxpath を使用して、「ここにはいくつかのテキストです」
しかし、XPathのと
html.xpath('//div[@id="uniqueID"]/text()').extract()
# returns [u'here ', u' text']
と
html.xpath('//div[@id="uniqueID"]/span/text()').extract()
# returns [u'is some']
どのように私はxpath、またはCSSですべてのテキストを取得できますか?
これはこの特定の例では機能しますが、私の場合はdiv内にスパンの数が不明です。 jQueryのtext()関数はスパンを無視します。私はおそらくちょうどdivを選択し、それを解析するためにPythonで何かを使用する必要がありますか? – TheJKFever
string()が無効なXPathを返す:./string() – TheJKFever
// div [@ id = "uniqueID"]/string()を試しましたか? – ibm701