私はクローラを初めて利用しています。私はPython 3.Xを使用しています。現在、私は新鮮なスタートのためにGoogleニュースをクロールするように練習していますが、コードに問題が発生しました(コードは実行されますが、何も返されませんでした)。私はコードがGoogleのニュースをクロールしてURLとタイトルとブリーフィングの結果を返すようにしたい。URL、タイトル、ブリーフィングで結果を返すGoogleニュースクローラ
お時間をありがとうございました。私のコードは以下の通りです:
import sys
import urllib
import requests
from bs4 import BeautifulSoup
import time
s = "Stack Overflow"
url = "http://www.google.com.sg/search?q="+s+"&tbm=nws&tbs=qdr:y"
#htmlpage = urllib2.urlopen(url).read()
time.sleep(randint(0, 2))
htmlpage = requests.get(url)
soup = BeautifulSoup(htmlpage.text,'lxml')
#print (len(soup.findAll("table", {"class": "result"})))
for result_table in soup.findAll("table", {"class": "result"}):
a_click = result_table.find("a")
print ("-----Title----\n" + a_click.renderContents())#Title
print ("----URL----\n" + str(a_click.get("href")))#URL
print ("----Brief----\n" + result_table.find("div", {"class": "c-abstract"}).renderContents())#Brief
print ("Done")
代わりにあなたのコードへのリンクを、あなたはこれを編集して、直接質問にそれを貼り付けてくださいすることができますか?あなたが間違っているかもしれないと思うことを教えてください。そして、どこに行き詰まっているのかを教えてください。 – SDsolar
私はコードを提供しました。私は、結果のURL、タイトル、ブリーフィングを印刷しない私のコードに悩まされています。 – Sun