2017-02-06 10 views
0

私はXML Rパッケージを使用しています。抽出後のコードとオブジェクトのドキュメント '内のXMLコード:XMLパッケージの文字列の一部を抽出する

doc = htmlParse(html, asText=TRUE), 

私は「ドキュメント」で、単純にこのXMLコードを持っていることを想像:

<p> interesting <a> not interesting </a> interesting2 </p> 

私は「面白いを抽出したいです'部分(すなわち、' a '部分以外のすべて)。

私はに表現するsimilarsを試してみました:

明らかに、ドキュメントのすべてのコンテンツを抽出し、
interesting <- xpathSApply(doc, "//p", xmlValue) 

。興味のある文字列だけを抽出するにはどうすればいいですか(つまり、興味深い興味深い2)。

ありがとうございます!

答えて

0

//*[not(self::a)]/text() waterling a

+0

感謝を除外します!下記を参照してください!! – JesusB

関連する問題