特定の単語を検索している次のHTMLスクリプトがあります。Scrapy:HTMLテキストの検索文字による特定の単語の選択
<tbody>
<tr>
<th>Berufsbezeichnung:</th>
<td class="gray">ExampleName</td>
</tr>
<tr>
<th>Anrede:</th>
<td class="gray">Herrn</td>
</tr>
<tr>
<th>Name:</th>
<td class="gray">ExampleLastName</td>
</tr>
<tr>
<th>Vorname:</th>
<td class="gray">ExampleSurname</td>
</tr>
…
</tbody>
私は別の変数「Berufsbezeichnung」、「Anrede」、...正しい内容で満たされなければなら持っていると思います。例えば "Berufsbezeichnung"のような同じデータセットでは、この変数は空のままでなければなりません。
私はありえない作業を、コンテンツを検索scrapyスクリプトを試してみましたが、それ:
soup = BeautifulSoup(response.css('table').extract()[0],'lxml')
for elem in soup.findAll('tr'):
for eleme in elem.findAll('th'):
if eleme.get_text()=='Berufsbezeichnung:':
Berufsbezeichnung = elem.css('td.gray::text')
if eleme.get_text()=='Anrede:':
Anrede = elem.css('td.gray::text')
...
は、誰かがアイデアまたは多分も簡単な方法がありますか?
ありがとうございます!
を - それは空の文字列(またはなしすることができ)。見つからない場合は、この変数に空の/デフォルトの文字列を設定します。 – furas
あなたは 'scrapy'を使用していますか?はいの場合、あなたは本当にbsoupを必要としません – eLRuLL