私はプログラミングの初心者です - この質問が適切でない場合は謝ります。私は今日、より良い部分のための答えをインターネットで検索するために最善を尽くしました。 私は、このリンクから画像を取得しようとしている:http://www.imdb.com/title/tt0076759/mediaviewer/rm2809748992特定のリンクから特定のイメージを取得するにはどうすればよいですか? (初心者プログラミング)
私は以下のコードを使用しています:(私はそれがすべてのイメージをフェッチ知っている。)
を私の質問がある - なぜにこのコードの動作を行いますこのリンク:http://www.imdb.com/title/tt0076759/?ref_=nv_sr_5このリンクにない:http://www.imdb.com/title/tt0076759/mediaviewer/rm2809748992?
import urllib2
import os
from BeautifulSoup import BeautifulSoup
URL = "http://www.imdb.com/title/tt0076759/mediaviewer/rm2809748992"
default_dir = os.path.join(os.path.expanduser("~"),"Pictures")
opener = urllib2.build_opener()
urllib2.install_opener(opener)
soup = BeautifulSoup(urllib2.urlopen(URL).read())
imgs = soup.findAll("img",{"alt":True, "src":True})
for img in imgs:
img_url = img["src"]
filename = os.path.join(default_dir, img_url.split("/")[-1])
img_data = opener.open(img_url)
f = open(filename,"wb")
f.write(img_data.read())
f.close()
私は、このリンクから画像を取得したいと思います:http://www.imdb.com/title/tt0076759/mediaviewer/rm2809748992
私は現在、このリンクから上記のコードで何の画像を取得していないのです。それは、しかし、他のリンクで動作します。リストが空で返すこと
imgs = soup.findAll("img",{"alt":True, "src":True})
:そのURL内のimg
タグは、あなたがそれらのimg
タグをフィルタリングするために定義されているalt
属性を持っていないため、
JavaScriptでレンダリングされているため、DOMにもっと多くのものがロードされている可能性があります。そのURLへの直接リクエスト(GETリクエスト)には、指定したタグは含まれません。 – eLRuLL
これを明確にしていただきありがとうございます。私はまだその特定のイメージを取得する方法を理解することが大好きです。 – Rinogg