bs4では、すべてのノードが接続されていて、すべてのリンクノード(実際にdivです)を取得した場合、タグAのような子を取得したいので、link.a
はokです。
ノードは2つの部分値を持ち、1つは属性、a['href']
によるアクセス、およびa.text
によるコンテンツアクセスです。 PS
for link in statements:
print(link.a['href'])
:
<a href="/Legislation-and-Politics/Legislative-Alerts/Letter-to-Representatives-opposing-the-Fairness-in-Class-Action-Litigation-and-Furthering-Asbestos-Claim-Transparency-Act">Letter to Representatives opposing the "Fairness in Class Action Litigation and Furthering Asbestos Claim Transparency Act"</a>
このlink.aある[ 'のhref']:
<div id="legalert_title"><a href="/Legislation-and-Politics/Legislative-Alerts/Letter-to-Representatives-opposing-the-Fairness-in-Class-Action-Litigation-and-Furthering-Asbestos-Claim-Transparency-Act">Letter to Representatives opposing the "Fairness in Class Action Litigation and Furthering Asbestos Claim Transparency Act"</a></div>
このlink.aある: このリンク変数であります
/Legislation-and-Politics/Legislative-Alerts/Letter-to-Representatives-opposing-the-Fairness-in-Class-Action-Litigation-and-Furthering-Asbestos-Claim-Transparency-Act
これは.textセクションです:
Letter to Representatives opposing the "Fairness in Class Action Litigation and Furthering Asbestos Claim Transparency Act"
すべてのhtmlはこのようになっていますが、多分あなたは少しhtmlを学ぶ必要があります。
興味のある情報を抽出するには、各リンクで「find」を呼び出す必要があります。Beautiful Soup docsを見てください –
Thanks jeff、私は美しいスープの文書を読んでいます。ソリューション –