私はの治療を初めて利用しています。私はウェブからいくつかのデータをクロールしたい。私は以下のようなhtml文書を手に入れました。いくつかの特定のタグのテキストを一緒にタグに入れてテキストを得る方法は?
<div class="user-info">
<p class="user-img">
something in p tag
</p>
<em>text</em> data I want
<a href="#">
something in a tag
</a>
</div>
私はのみたいテキストデータを取得したいです。しかし、のテキストは、タグ<em></em>
に入っています。だから私がdiv[contains(@class, "user-info")]/text()
を使用した場合、私はがほしいと思うデータを得ることができます。 div[contains(@class, "user-info")]/node()
を使用すると、すべてのタグがdiv.user-info
、さらにdiv[contains(@class, "user-info")]/node()/text()
になります。ですから、どうすればのテキストとのデータをと一緒にのテキストデータにしたいのですか??
感謝を使用していますが、EM多分例えばデータ内:私はしたいテキストデータは、それがためだ失われました。 – Simon
try '// div [@ class =" user-info "] //テキスト()[親(親:: aまたは親:: p)]' – Andersson