2016-12-12 12 views
0

内のすべての要素:のXPath - 私はこのクエリを使用してきた体

//*[self::div or self::p or self::span]/text()[normalize-space()][string-length() > 140] 

..しかし、それはまた非必須要素からコンテンツをフェッチ(<head>等。)ので、私は、検索を制限したいです<body>内が、これは何らかの理由で動作しません:

//body/*[self::div or self::p or self::span]/text()[normalize-space()][string-length() > 140] 

...このHTMLのために:http://pastebin.com/F4xVDL8Q

答えて

1

indicatあなたのXPathの以下の部分

//body/* 

あなたがbody内のすべての要素を検索することを意味するので、その後//*が代わりに使用されてきたはずです::

//body//*[...]/text()[...][string-length() > 140] 
を検索のみ 直接の子にbody要素をすべき電子