import requests
from bs4 import BeautifulSoup
urla = 'https://www.tumblr.com/search/hello'
r = requests.get(urla)
soupa = BeautifulSoup(r.content, 'html.parser')
links = soupa.find_all("div", {"class": "header_mage_wrapper has_avatar"})
for link in links:
print link
このコードを実行すると、何も壊れず、終了コード0(PyCharmを使用)が表示されますが、出力はまったくありません。美しいスープで出力なし
私は離れて{「クラス」:「header_mage_wrapperのhas_avatar」を}取る場合) はこれだけfind_all(「DIV」)が存在し、それは完全に正常に動作し、すべてのdivを引き出します。私はこの同じコードを別のウェブサイトで試しても何の問題もありませんでしたが、まだ分かりませんが、私はBeautifulSoupを1〜2日使っていますが、見つけられませんコーディングエラーがないので問題です。
ありがとうございました!
あなたが私にリンクしたページのソースには、 'header_mage_wrapper has_avatar'が見つかりません。それを確認できますか? – minocha
これらのクラスとdivがあるとはどのように判断しましたか?そのようなクラスはありませんが、 'header_mage_wrapper'は' header_image_wrapper'のスペルミスのようです。 –
おそらくあなたはJavaScriptをパースしようとしている可能性があります。これは少し違ってやる必要がありますし、Martijnが言及したように、あなたはたぶんクラスを正しく綴っていないでしょう。 –