で一つ一つ私がIndeedから1ページのソースをダウンロードし、私はそのために私は、このXPathを使用しています、そこからすべてのジョブ・タイトルを取得しようとしている結果:選択しscrapy
response.xpath('//*[@class=" row result"]//*[@class="jobtitle"]//text()').extract()
問題は、結果が故に1行ではなく、ということである。この結果取得:
私がしたいことは一つ一つのプロセスにジョブを選択することで、データの残りの部分とマッピングする問題がある[u'\n ',
u'Data',
u' ',
u'Scientist',
u' Experto SQL con conocimiento en R',
u'\n ',
u'\n ',
u'Data',
u' Analytic con Python',
u'\n ',
u'\n ',
u'Data',
u' Analytic con R',
、何かをextract_first()と似ています
response.xpath('//*[@class=" row result"]').extract_first()
ただし、任意のインデックスとデータの処理を継続するオプションがあります。 私はこの試みた:
current_job = response.xpath('//*[@class=" row result"]').extract_first()
current_job = TextResponse(url='',body=current_job,encoding='utf-8')
をしかし、それは唯一の最初の結果のために働く、それは私にはニシキヘビのアプローチのようには見えません。
何か? @KlausD。 –
私はscrapyに組み込まれたものを探しているので、TextResponse()を毎回使用する必要はありません。存在するかどうかはわかりません。 –
'for'ループを使用できませんか? – furas