0
内のすべての要素:のXPath - 私はこのクエリを使用してきた体
//*[self::div or self::p or self::span]/text()[normalize-space()][string-length() > 140]
..しかし、それはまた非必須要素からコンテンツをフェッチ(<head>
等。)ので、私は、検索を制限したいです<body>
内が、これは何らかの理由で動作しません:
//body/*[self::div or self::p or self::span]/text()[normalize-space()][string-length() > 140]
...このHTMLのために:http://pastebin.com/F4xVDL8Q