私はの治療を初めて使用しています。私はウェブからいくつかのデータをクロールしたい。私は以下のようなhtml文書を手に入れました。Pythonで親ノードをscrapyで取得する方法は?
dom style1:
<div class="user-info">
<p class="user-name">
something in p tag
</p>
text data I want
</div>
dom style2:
<div class="user-info">
<div>
<p class="user-img">
something in p tag
</p>
something in div tag
</div>
<div>
<p class="user-name">
something in p tag
</p>
text data I want
</div>
</div>
は、私は今、私はそれが存在チェックでそれを得るためにCSSまたはのxpathセレクタを使用することができ、私はたいデータテキストデータを取得したいです。しかし、私はいくつかのより良い方法を知りたい。 例えば、私は最初のCSS p.user-name
を得ることができ、その後、私はそれが親だを取得し、その後、私はそれがdiv/text()
だ取得し、常に私が欲しいデータがp.user-name
の直接の親div
のtext()
ですが、質問があり、直接の親を得るにはどうすればいいですかp.user-name
?
いいね、ありがとう、ありがとう。 – Simon