import urllib2
import BeautifulSoup
request = urllib2.Request("https://adexchanger.com/searchresults/?q=digital%20marketing")
response = urllib2.urlopen(request)
soup = BeautifulSoup.BeautifulSoup(response)
for a in soup.findAll('a'):
if 'digital marketing' in a['href']:
print a
-3
A
答えて
0
サイトどうやらブロックロボットやボット/ Mozzilaヘッダーはブラウザのように動作します。以下のコードを試してみてください。
>>> headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36'}
>>> req = urllib2.Request('https://adexchanger.com/searchresults/?q=digital%20marketing', None, headers)
>>> urllib2.urlopen(req)
<addinfourl at 140245639765816 whose fp = <socket._fileobject object at 0x7f8d7b865250>>
関連する問題
- 1. 昇給HTTPError(req.get_full_url()、コード、MSG、HDRS、FP)
- 2. urllib2.HTTPErrorでCDYNEを要求する:HTTPエラー400:不正リクエスト
- 3. ピップインストールに失敗しました:SSLが必要です
- 4. urllib2.HTTPErrorに遭遇しました:HTTPエラー400:不正なリクエスト
- 5. Rails open_uriとamazon s3 `open_http ':403禁止(OpenURI :: HTTPError)
- 6. HttpError 403 google directory api
- 7. HTTP POST要求エラーHTTPError:不正要求
- 8. HTTPエラー403(禁止)
- 9. OpenURI :: HTTPError 403禁止 - S3に保存された資産のペーパークリップURLを開く
- 10. Spring CSRF HTTP 403禁止エラー
- 11. HTTPエラー:HTTPエラー400:不正なリクエスト(HTTPリクエストを作成するためにurllib2を使用する必要があります)
- 12. urllib.error.HTTPError:禁止されたHTTPエラー403:
- 13. .NETコアでHTTP要求が403禁止されたエラーが発生する
- 14. apache2 mod_substitute with HTTP 403禁止コード
- 15. Googleのアプリエンジン:エラー:HTTPError
- 16. HTTP 403禁止リクエスト時の禁止ジャージ
- 17. カイロス顔認識 - Pythonの2:私は、私が登録ステム(<a href="http://docs.kairosv1.apiary.io/#reference/face-recognition/enroll/post" rel="nofollow noreferrer">http://docs.kairosv1.apiary.io/#reference/face-recognition/enroll/post</a>)のためのカイロスのサンプルコードを作成しようとしています写真
- 18. Python 3、urlopen - HTTPエラー403:禁止
- 19. SuiteCRM 403エラー(禁止)
- 20. FP成長 - トランザクション内のアイテムは一意である必要があります
- 21. アナコンダ - HTTPError
- 22. 取得403禁止されたエラーです。クライアント認証スキーム「Anonymous」でHTTPリクエストが禁止されました
- 23. HttpError 400 Googleクラウドストレージ
- 24. PythonはHTTPError
- 25. C#WebRequest - HTTP:403禁止( '_xsrf'引数がPOSTにありません)
- 26. なぜPythonのurllib2.urlopen()は正常なステータスコードのためにHTTPErrorを発行しますか? <a href="http://docs.python.org/howto/urllib2.html#httperror" rel="noreferrer">the urllib2 documentation</a>による
- 27. リダイレクトではなく、禁止状態コード403でAuthorizeAttributeを応答させる方法はありますか?
- 28. HTTPエラー403禁止 - nltkデータをダウンロードするとき
- 29. ServicePlacementPreferPrimaryDomainPolicyDescriptionをコードまたはマニフェストファイルに追加する必要はありますか?
- 30. Ubuntu Bundler HTTPError
このサイトにアクセスできないというエラーメッセージが表示されます –
このウェブサイトからリンク(デジタルマーケティングという用語を含む)を抽出しようとしています。この問題に近づく方法はありますか? – Rrj17
ヘッダーのブラウザチェックでアクセスできますが、 –