ドキュメントのすべてのテキストノードを取得したいが、ハイパーリンクに含まれていないノードのみを取得したい。XPathを使用すると、ハイパーリンクの一部ではないテキストノードを取得する方法
試験サンプル:
Hello <a class='foobar' href='foo.html'>foo</a>World Hello foo World
結果テキスト・ノードは、こんにちはfooの世界でテキストノードではなく、ハイパーリンクを含める必要があります。
私は"//*[not(@href)]/text()"
を試しましたが、これは動作していません。 (うまくいけば)以下の私の答えとして
UPDATE
は私の問題は、クエリがルートノード自体ルートノード内のノードを探していますが、いなかったということでした、説明しています。私の答えは以下の通りです。
Andrewは別のアプローチを思いつきましたが、その意図はおそらくより明確です。
優れています。 XPathクエリを書く方法はたくさんあります。 – John
これは私が知りませんでした 'xpath' utilの+1です。どうもありがとうございました! –
opensuseの "werken-xpath"パッケージに入っていて、http://sourceforge.net/projects/werken-xpath/から来ているようです。正直言って私はsaxonをやってもらえませんでした。急いで望んでいたとopensuseは代わりにそれを記載... –