私は美しいスープを使用しており、Webページから情報を入力するよう要求しています。タイトルだけの書籍タイトルのリストを取得しようとしています。タイトルのフォントで。Pythonの正規表現は一致しますが、文字は含まれていません美しいスープ
例のテキスト= 'ジャンクタイトルの束= BOOK1よりジャンクテキストのタイトル= BOOK2'
私は
ですtitleList = [ 'タイトル= BOOK1'、 'タイトル= BOOK2']を取得していますどのような私はtitleList = ['book1'、 'book2']
私は試してみましたが、それはタイトル=とbook1の単語を壊していますが、私はリストに単にグループ(2)を追加する方法がわかりません。
titleList = []
def getTitle(productUrl):
res = requests.get(productUrl, headers=headers)
res.raise_for_status()
soup = bs4.BeautifulSoup(res.text, 'lxml')
title = re.compile(r'title=[A-Za-z0-9]+')
findTitle = title.findall(res.text.strip())
titleList.append(findTitle)
あなたが作業しているHTMLの例を投稿することができますか? – Stats4224
これは本当にBeautifulSoupの質問ですか?あなたは実際に 'スープ'オブジェクトを使用しません。 – alecxe
なぜあなたはbeautifulsoupを使用しているのですか? –