0
を使用して、この映画のウェブサイトをこすりすることができません:http://www.21cineplex.com/nowplaying私はここに映画のウェブサイトをスクラップしようとしていますBeautifulSoup
私はこの質問では画像としてHTML本体とスクリーンショットをアップロードしています。 link to screenshot here<P>
タグの一部である映画のタイトルと説明を取得しようとするのが難しいです。いくつかの奇妙な理由で、記述は要求オブジェクトの一部ではありません。また、ulとクラス名を見つけるためにスープを使用しようとしたとき、それを見つけることができません。誰でも知っている理由は?このサーバはReferer
ヘッダをチェックしている
r = requests.get('http://www.21cineplex.com/nowplaying')
r.text (no description here)
soup = bs4.BeautifulSoup(r.text)
soup.find('ul', class_='w462') # why is this empty?
あなたが実際のWebブラウザではないことを認識した場合、サーバが別のページを送信する可能性があります。リクエストで 'user-agent'ヘッダを設定しようとします。 – furas