コンソールpythonの出力がありません

from bs4 import BeautifulSoup 
import requests 

def imdb_spider(): 
    url = 'http://www.imdb.com/chart/top' 
    source_code = requests.get(url) 
    plain_text = source_code.text 
    soup = BeautifulSoup(plain_text) 
    for link in soup.findAll('a', {'class': 'secondaryInfo' }): 
     href = link.get('href') 
     print(href) 

imdb_spider()

私はimdbのすべての最高評価映画のリンクを取得しようとしています。私はpycharmを使用しています。コードは30分以上実行されますが、私のコンソールには何も印刷されません。コンソールpythonの出力がありません

出典

2016-11-26 Avinash

「source_code」はどこにありますか？このコードは実行できません。エラーメッセージが表示されます。 – furas

IMDBのpythonライブラリがあります... http://imdbpy.sourceforge.net –

ここで 'requests'を使用していますか？行を貼り付けるのを忘れましたか？ –

{'class': 'secondaryInfo' }は、<span>オブジェクトのパラメータです。

from bs4 import BeautifulSoup 
import requests 


def imdb_spider(): 
    url = 'http://www.imdb.com/chart/top' 
    source_code = requests.get(url) 
    plain_text = source_code.text 
    soup = BeautifulSoup(plain_text, "lxml") 
    for td in soup.findAll('td', {'class': 'titleColumn'}): 
     href = td.find('a').get('href') 
     print(href) 


imdb_spider()

出典

2016-11-26 17:01:57

あなたはすべての映画のタイトルのためのクラスsecondaryInfoを持つ要素があることを正しいですが、それはa要素ではありません。

だからこれを試してみてください。それを見つけたい場合は、別のセレクターを使用する必要があります。たとえば、次のセレクタは soup.findAll()の代わりにトリックを行います。

soup.select('td.titleColumn a')

出典

2016-11-26 17:06:29

ありがとう、それは働いた:) – Avinash

素晴らしい！私が手伝ったら答えを受け入れることができますか？ –

コンソールpythonの出力がありません

答えて

関連する問題