0
私はXML Rパッケージを使用しています。抽出後のコードとオブジェクトのドキュメント '内のXMLコード:XMLパッケージの文字列の一部を抽出する
doc = htmlParse(html, asText=TRUE),
私は「ドキュメント」で、単純にこのXMLコードを持っていることを想像:
<p> interesting <a> not interesting </a> interesting2 </p>
私は「面白いを抽出したいです'部分(すなわち、' a '部分以外のすべて)。
私はに表現するsimilarsを試してみました:
明らかに、ドキュメントのすべてのコンテンツを抽出し、interesting <- xpathSApply(doc, "//p", xmlValue)
。興味のある文字列だけを抽出するにはどうすればいいですか(つまり、興味深い興味深い2)。
ありがとうございます!
感謝を除外します!下記を参照してください!! – JesusB