2017-10-09 4 views
2

私は、多くのオーストラリア企業の財務諸表をpdfとして入手しようとしています。私はパンダのデータフレームに格納されているすべての企業を持って、自分の会社の名前が呼ばれる列にある「企業」これは、URLを検索するために、これまでに私のコードです:(予想通り)Pythonを使用した広告ではないGoogle検索の最初の結果を取得するにはどうすればよいですか?

import webbrowser 

tabUrl = "http://google.com/?#q=" 
append = "+financial+report+2017" 
file_type = 'filetype%3Apdf+' 

for company in data["Company"]: 
     googleSearch = tabUrl + file_type + company.replace(" ", "+") + append 
     print(googleSearch) 

すべての検索リターンの数最初の結果として広告が表示されます。広告ではない最初の結果を開くにはどうすればよいですか?

ありがとうございます!

答えて

2

今、あなたは、GoogleのウェブページのURLにリクエストを送信していて、https://www.google.com

これを行うには良い方法に行く場合は、Googleに表示広告が含まれます表示された結果は、ためにGoogle Custom Search APIを使用することですあなたの要求を送信し、結果を得る。あなたがあなたのAPI KEYカスタム検索エンジンIDが

GET https://www.googleapis.com/customsearch/v1?key=INSERT_YOUR_API_KEY&cx=017576662512468239146:omuauf_lfve&q=lectures 
を生成したら、あなたはそれらのサービスのエンドポイントに REST要求を行うことができていることがわかり、そのドキュメントから https://developers.google.com/custom-search/json-api/v1/using_rest

:あなたはここにドキュメントを取得することができます

関連する問題