0
を使用して、同じクラスのタグのそれぞれに異なります。タグ内に保持されたID値を取得しますが、私は私が後だデータはdivのクラス内で保持されているウェブサイトをスクレイピングしていますBeautifulSoup
<div class="cat 108070288">
I
containers = soup.findAll("div", {"class" : re.compile("cat.*")})
これは私に必要なすべての容器を提供します。
私が後にしているのは「猫の番号」です。だから私は、次の操作を行います。
for container in containers:
print container.get("class")
これは、このようなリストを生成します。
[u'cat', u'119482588']
[u'cat', u'119317618']
[u'cat', u'109582818']
[u'cat', u'119089813']
[u'cat', u'118819718']
[u'cat', u'118728418']
[u'cat', u'106407623']
は、どのように私は唯一のIDを取得していますか?すなわち、
119482588
119317618
109582818
119089813
118819718
118728418
106407623