美しいスープと正規表現を使用しようと少し問題があります。美しいスープと正規表現を使用
私のHTMLは次のよう:
[<strong>See the full calendar</strong>, <strong>See all events</strong>, <strong>See all committee meetings</strong>, <strong>526 spaces</strong>, <strong>89 spaces</strong>, <strong>53 spaces</strong>, <strong>154 spaces</strong>, <strong>194 spaces</strong>, <strong>See all news releases</strong>]
[<strong>See the full calendar</strong>, <strong>See all events</strong>, <strong>See all committee meetings</strong>, <strong>526 spaces</strong>, <strong>89 spaces</strong>, <strong>53 spaces</strong>, <strong>154 spaces</strong>, <strong>194 spaces</strong>, <strong>See all news releases</strong>]
を私が欲しいものは、強力なタグの間にスペースの数だけあります。
私が使用して試してみました:
print(soup.find_all(re.compile("\d\d\d\s[a-zA-Z]{6}|(strong)")))
をしかし、これはprint(soup.find_all('strong'))
が行うすべてのものを返しています。
誰かが間違っていると知っていますか?私が正しくあなたを理解している場合
ありがとうございました! AttributeError: 'ResultSet'オブジェクトに属性 'split''がありません - アイデアはありますか? @Ludisposed – Maverick
すべてのスペースの合計が必要な場合、またはそれぞれの強力なタグにはスペースカウンタが必要ですか? – Ludisposed
最終目標はこれをcsvにエクスポートすることです。各 "x spaces"は各行ごとに別々のレコードにする必要があります – Maverick