2017-02-18 34 views
0

クエリ用のGoogle検索結果スニペットを抽出する必要があります.i BeautifulSoupをPythonで使用しています。私のコードは次の通りです:pythonを使用してGoogle検索スニペットを抽出するbeautifulsoup

question = "Where is Tajmahal?" 
opener = urllib2.build_opener() 
opener.addheaders = [('User-agent', 'Mozilla/5.0')] 
query = question 
query = urllib.urlencode ({ 'q' : query }) 
url = "http://www.google.com/search?%s&"+query 
page = opener.open(url) 
soup = BeautifulSoup(page) 

ここから進める方法はわかりません。私はどのタグでGoogleの検索スニペットが格納されているかわかりません。

答えて

0

はあなたのコードの最後に次の行を追加します。助けてください:

google_html = open('google.html', 'w') 
google_html.write(str(soup.prettify())) 
google_html.close() 

次に、あなたが探しているどのタグを把握するために、HTMLを見に行きます。あなたの質問は、正確に何を得たいかについて漠然としていますし、あなたが望むものではないかもしれないことを印刷するファイルを見るときに気付くかもしれません。