1
私はScrapyが間違っていると思いますが、xpathを使用してH2のテキストのみを選択し、内側のタグを取り除こうとしています。ネストされた要素のxpathを処理する
例えば、
<h2>Welcome to my <a href="#">page</a></h2>
<h2>Welcome to my Page</h2>
私は//h2//text()
を使用して試してみましたが、それは私が組み合わせの数を試してみましたが、ちょうど私が
item["h2s"] = response.xpath('//h2//text()').extract()
['Welcome to my',
'page',
'Welcome to my Page']
のような配列を生成
ファンタスティック、ちょうどそれを試してみましたが、完全に働いた:)感謝を。比較的簡単なことでScrapyでやるのはかなり複雑なようです。 –