私はこのクエリを他のURLで何百万回も(はい、何百万回)実行しました。しかし、次のWebページのコンテンツタイプをチェックするときにKeyErrorが発生します。一部のリクエストのヘッダーでコンテンツタイプが空白になっています
コードスニペット:
r = requests.get("http://health.usnews.com/health-news/articles/2014/10/15/limiting-malpractice-claims-may-not-curb-costly-medical-tests", timeout=10, headers=headers)
if "text/html" in r.headers["content-type"]:
エラー:
KeyError: 'content-type'
を私はr.headers
の内容をチェックし、それはです:
CaseInsensitiveDict({'date': 'Fri, 20 May 2016 06:44:19 GMT', 'content-length': '0', 'connection': 'keep-alive', 'server': 'BigIP'})
これを引き起こしている可能性がありますか?
おそらく、単一のIPからの要求の抑制が原因でしょうか? PS:あなたは素晴らしい人です。 – User
@ユーザー:難しいと言えるかもしれません。 HTTPサーバーはブラックボックスであり、彼らは彼らがどのようにうまくいけばいいか応答することができます。私は、 'Server'ヘッダーも私たちと違うことに気付きました。 –