2017-01-24 8 views
1

私はアタンプトでbs4を使用して画像へのウェブリンクをthe metropolitanから取得しています。bs4は変数名を返しますが、内容は返しません

url = 'http://www.metmuseum.org/art/collection#!?material=Canvas&showOnly=onDisplay&offset=1780&pageSize=0&sortBy=Relevance&sortOrder=asc&perPage=20' 
soup =BeautifulSoup(urlopen(url).read().decode(),'html5lib').encode() 

元のウェブページでは、私が望むデータは、私が望むリンクを保持するこのように見えます。

<figure class="card__standard-image"> 
     <a href="/art/collection/search/459087?sortBy=Relevance&amp;amp;what=Oil+paintings%7cPaintings&amp;amp;od=on&amp;amp;ft=*&amp;amp;offset=0&amp;amp;rpp=20&amp;amp;pos=1"> 

BS4によって返されたデータは次のようになります。

<figure class="card__standard-image">\n  <a href="{{ card.url }}"> 

リンクがcard.urlで置き換えられるように私には思えるが、私はに格納された値をアクセスも方法がわかりませんカード。

私は別のパーサーを試しましたが、役に立たないです。

答えて

1

必要なデータではJavaScriptによってフェッチされ、読み出しデータはこのURLである:

http://www.metmuseum.org/api/collection/collectionlisting?artist=&department=&era=&geolocation=&material=Canvas&offset=0&pageSize=0&perPage=20&showOnly=onDisplay&sortBy=Relevance&sortOrder=asc 

enter image description here

+0

おかげで、これは、このインスタンスのために私の問題を解決しました。次回は、このURLをどうやって見つけましたか? –