私は、公共のInstagramアカウントから画像をスクラップしたいと思います。私はかなりbs4に精通しているので、私はそれを始めました。 Chrome上の要素インスペクタを使用して、ピクチャは並べ替えられていないリストにあり、liにはクラス '写真'があることに気付きました。そのため、findAllで酷くすることはできません。Instagram with BeautifulSoupを取り除く方法
間違った:それは何も(以下コード)を返さないと、私はすぐにコードは要素インスペクタに示されており、私がリクエストから描いたコードは、私が引っ張っコードで同じ AKAなし順不同リストではなかったことに気づきますリクエストから。
要素インスペクタに表示されるコードをどのように取得できますか?
from bs4 import BeautifulSoup
import requests
import re
r = requests.get('http://instagram.com/umnpics/')
soup = BeautifulSoup(r.text)
for x in soup.findAll('li', {'class':'photo'}):
print x
はあなたの助けをありがとう:
は、念のために、これは順不同リストがなかったため動作しませんでした、開始するための私のコードでした。
このページはJavaScriptを大量に使用しています。ブラウザでダウンロードしたものを見るには、* source *ページ(Chrome:View - > Developer - > View Source)を見たいと思っています。インスペクタで表示されるのは、ページから参照されるJavaScriptを実行した後にブラウザが構築したものです。 –