2017-06-24 3 views
0

からタイトルをこすります映画のBeautifulSoup:</p> <p><a href="https://www.themoviedb.org/discover/movie?page=1" rel="nofollow noreferrer">https://www.themoviedb.org/discover/movie?page=1</a></p> <p>とタイトルのリストを返す:私は、これは、特定のですけど、私は、以下のウェブサイトをこすりする方法を見つけるために探していますwww.themoviedb.org

私はBeautifulSoup試してみた:

from bs4 import BeautifulSoup 
import requests 

r = requests.get('https://www.themoviedb.org/discover/movie?page=1') 

soup = BeautifulSoup(r.text) 
soup 

は、しかし、私は、出力内のタイトルのいずれかを見つけることができません。私はこれを初めて知りましたが、誰かがこれをどうやって行うかの例を提供できるかどうか疑問に思っていました。

+3

私はTMDBのためのAPIで構築を使用することをお勧め。こちらをご覧ください:https://www.themoviedb.org/documentation/api – David

答えて

1

を、映画についての情報がクラスinfo<div>の内部に位置しているようです。

from bs4 import BeautifulSoup 
import requests 

r = requests.get('https://www.themoviedb.org/discover/movie?page=1') 

soup = BeautifulSoup(r.text, "html5lib") 
items = soup.find_all('div', {'class' : 'info'}) 

for item in items: 
    print(item.p.a['title']) 

出力:

Split 
Miss Peregrine's Home for Peculiar Children 
Deadpool 
Captain America: Civil War 
X-Men: Apocalypse 
Fantastic Beasts and Where to Find Them 
Arrival 
Tomorrow Everything Starts 
Doctor Strange 
La La Land 
Sing 
The Great Wall 
Rogue One: A Star Wars Story 
Batman v Superman: Dawn of Justice 
Hacksaw Ridge 
Zootopia 
Inferno 
Star Trek Beyond 
Now You See Me 2 
Passengers 
0

これは非常に近いあなたを取得する必要があります:HTMLを見て

for x in soup.find_all('div', {'class': 'item poster card'}): 
    print list(x.find_all('a')[1]) 
関連する問題

 関連する問題