"text"属性を使用して、BeautifulSoupを使用してHTMLに埋め込まれたテキストを解析しようとしています。 「見つける」と「findAllの」で遊んで、私は奇妙な何かに気づくと...それはこのように動作する理由を中心に第二の試験でPython BeautifulSoup - findとfindAllで異なる結果
import re
import BeautifulSoup
doc = "<html><head><title>Page title</title><title>Author name</title></head>"
soup = BeautifulSoup(doc)
# find test
test1 = soup1.find('title',text=re.compile("Page"))
print test1 # Returns "Page title"
# findAll test
test2 = soup1.findAll('title',text=re.compile("Page"))
print test2 # Returns "[<title>Page title</title>, <title>Author name</title>]"
を私の頭を取得することはできません、パーサーが返すべきではありません最初の例と同じ結果ですか? 2番目のテストは、テキストに "Page"が含まれているすべての 'title'タグを返す必要がありますが、2番目のtitleタグも返します。
これが予定されているのですか、何か不足していますか?
私はこれを見ました。 findを使っても問題はありませんでしたが、おそらくドキュメントのtypoです。 – JasonB