特定のhtmlタグの内容を傷病や美しいスープで抽出するには？

私はこの治療法で改善するために、このsiteのおもちゃのクローラを作っています。このように、私が試したscrapyシェルで：美しいスープやscrapyで特定のhtmlタグの内容を傷病や美しいスープで抽出するには？

In [1]: for e in response.css('meta.keywords').extract(): 
    ...:  print(e) 

Out: 

<meta class="keywords" itemprop="keywords" content="abilities,choices"> 
<meta class="keywords" itemprop="keywords" content="inspirational,life,live,miracle,miracles"> 
<meta class="keywords" itemprop="keywords" content="aliteracy,books,classic,humor"> 
<meta class="keywords" itemprop="keywords" content="be-yourself,inspirational"> 
<meta class="keywords" itemprop="keywords" content="adulthood,success,value"> 
<meta class="keywords" itemprop="keywords" content="life,love"> 
<meta class="keywords" itemprop="keywords" content="edison,failure,inspirational,paraphrased"> 
<meta class="keywords" itemprop="keywords" content="misattributed-eleanor-roosevelt"> 
<meta class="keywords" itemprop="keywords" content="humor,obvious,simile">

どのように私は、各metaの内容を得ることができますか？。

出典

2017-05-08 tumbleweed

単に 'e.content'を使用してください。 –

何を使用しますか？スクラブやbeautifulsoup ... –

あなたが実際にあなたのセレクタを調整することにより、一度にそれを行うことができます：attrはScrapy自体によって追加の非標準custom selectorであること

for e in response.css('meta.keywords::attr(content)').extract(): 
    print(e)

注意。

出典

2017-05-08 13:25:38 alecxe

特定のhtmlタグの内容を傷病や美しいスープで抽出するには？

答えて

関連する問題