Google画像検索のソースコードを取得したいと考えています。Google Search by Image Script for Local Imagesで、https://www.google.com/searchbyimage?&image_url=
+ image link
という作品があります。私は、Pythonを使用していますが、これは私が試したものです:私たちはthisにview-source:
を追加する場合、Chromeのソースコードからかなり異なっているBeautifulSoupのHtmlがブラウザのソースコード(Python3.5)と異なる
from bs4 import BeautifulSoup
import requests
browser = 'Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.0.7) Gecko/2009021910 Firefox/3.0.7'
headers={'User-Agent':browser,}
url = ("https://www.google.com/searchbyimage?&image_url="+"http://mlm-s1-p.mlstatic.com/635657-MLM25528207389_042017-O.jpg")
page = requests.get(url, headers= headers)
soup = BeautifulSoup(page.text, "html.parser")
pretty = soup.prettify()
print(pretty)
。
あなたが知りたいのであれば、スクリプトの目的は、Googleのイメージの推測を文字列として見つけることです。私の例ではlemmy kilmister funko pop
となりますが、美しいスープのhtml。
編集:ライブラリとbeautifulsoup /要求を含めるのを忘れました
それはjavascriptを使用して作成することができます。それを動作させるには、乾燥したスクレープまたはセレンを使用する必要があります。 –