2
私はこの治療法で改善するために、このsiteのおもちゃのクローラを作っています。このように、私が試したscrapyシェルで:美しいスープやscrapyで特定のhtmlタグの内容を傷病や美しいスープで抽出するには?
In [1]: for e in response.css('meta.keywords').extract():
...: print(e)
Out:
<meta class="keywords" itemprop="keywords" content="abilities,choices">
<meta class="keywords" itemprop="keywords" content="inspirational,life,live,miracle,miracles">
<meta class="keywords" itemprop="keywords" content="aliteracy,books,classic,humor">
<meta class="keywords" itemprop="keywords" content="be-yourself,inspirational">
<meta class="keywords" itemprop="keywords" content="adulthood,success,value">
<meta class="keywords" itemprop="keywords" content="life,love">
<meta class="keywords" itemprop="keywords" content="edison,failure,inspirational,paraphrased">
<meta class="keywords" itemprop="keywords" content="misattributed-eleanor-roosevelt">
<meta class="keywords" itemprop="keywords" content="humor,obvious,simile">
どのように私は、各meta
の内容を得ることができますか?。
単に 'e.content'を使用してください。 –
何を使用しますか?スクラブやbeautifulsoup ... –