URLを使用してWebページをスクラップしようとしたときに、一部の要素が一部のページにのみ存在し、のは、例えばPython:すべてのWebページに特定の要素があるわけではありません
コードをコードを見てみましょう:
for urls in article_url_set:
re=requests.get(urls)
soup=BeautifulSoup(re.text.encode('utf-8'), "html.parser")
title_tag = soup.select_one('.page_article_title')
if title_tag=True:
print(title_tag.text)
else:
#do something
がtitle_tagが終了した場合、私はそれがない場合は、それらを印刷したい、ちょうどそれらをスキップします。
もう1つのことは、他の要素とtitle.tag.textをデータに保存する必要があることです。
data={
"Title":title_tag.text,
"Registration":fruit_tag.text,
"Keywords":list2
}
それは私が私が保存しようとすると、それらをスキップするために何をすべき、すべての記事がタイトルを持っていない、エラーの原因があるのだろうか? 'NoneType'オブジェクトに 'text'属性がありません
編集:私はそれらをスキップしてNullまたはNoneとして保持します。
ありがとう!私は実際に昨日ソートしました。あなたのすべての助けに本当に感謝します! – Makiyo