私はすべてのiframe
をウェブページから入手したいと思います。辞書のPythonのリストを作成
コード:
site = "http://" + url
f = urllib2.urlopen(site)
web_content = f.read()
soup = BeautifulSoup(web_content)
info = {}
content = []
for iframe in soup.find_all('iframe'):
info['src'] = iframe.get('src')
info['height'] = iframe.get('height')
info['width'] = iframe.get('width')
content.append(info)
print(info)
pprint(content)
print(info)
の結果:pprint(content)
の
{'src': u'abc.com', 'width': u'0', 'height': u'0'}
{'src': u'xyz.com', 'width': u'0', 'height': u'0'}
{'src': u'http://www.detik.com', 'width': u'1000', 'height': u'600'}
結果:
[{'height': u'600', 'src': u'http://www.detik.com', 'width': u'1000'},
{'height': u'600', 'src': u'http://www.detik.com', 'width': u'1000'},
{'height': u'600', 'src': u'http://www.detik.com', 'width': u'1000'}]
なぜ正しくないコンテンツの価値はありますか?私がprint(info)
のときの値と同じであると考えられます。
おかげで、これは、Pythonを使用して私の最初のコードです。また、素早く応答してくれてありがとう – l1th1um