を含むHTMLタグを見つけることができません。その後、Using BeautifulSoup to find a HTML tag that contains certain textBeautifulSoupは、私はちょうど私のHTML文字列に「//」を持っているすべての要素を取得するために正規表現を使用したい、と私はこの質問から答えをたどる特定のテキスト
そして、私は同様のものをコーディング:
from BeautifulSoup import BeautifulSoup
import re
html_text = \
"""
<html>
<!--<![endif]-->
<head>
<link rel="stylesheet" href="//abc.com/xyz" />
<meta rel="stylesheet" href="//foo.com/bar" />
</head>
</html>
"""
soup = BeautifulSoup(html_text)
for elem in soup(text=re.compile(r'//')):
print elem
私はのような結果を持っているだろうと期待:
//abc.com/xyz
//foo.com/bar
しかし、私は何も受け取りません。彼らのテストケースがなぜ機能するのか分かりません、エラーがありますか、スクリプトに何かが恋しいですか?
これらの例では、タグの 'text'コンテンツを検索しています。あなたのものは' href'属性として定義されています。 'text 'を' href'(例えば 'soup(href = re.compile(r" // "))')に置き換えてみてください。 – zwer
@ zwerありがとう:D – Blurie