解決策が必要urllib2 - 優秀な図書館

私はurl lib2で作業しています。私は助けが必要です。私はウェブサイトから必要な情報を取得するとうまくいきますが、ウェブサイトの情報が変わっても結果は変わりません。私は "キャッシュ"や " lib.close "...私は知らない...誰かがそれで私を助けてくれますか？ありがとうここ解決策が必要urllib2

は、コードは次のとおりです。

import urllib2    

url = 'http://website.com' 

response = urllib2.urlopen(url) 
webContent = response.read() 

string = webContent.find('***') 
alert = webContent[string+11:] 

webContent = alert 
string = webContent.find('***') 
alert = webContent[:string] 
alert = alert.replace('</strong>',' ') 

print alert

出典

2016-04-09 Thiago Neves

urllib2のキャッシュを行いません。 HTTPプロキシが含まれているか、サーバー側でキャッシュが行われています。

応答ヘッダーを確認してください。 X-CacheまたはX-Cache-Lookupは、プロキシ経由で接続されていることを意味します。

出典

2016-04-09 13:50:32 dron22

ありがとう、私はXキャッシュとXキャッシュの検索を調べて、私のための解決策を見つけることができました... 私はウェブサイト上の情報を変更し、それはすぐに更新されます... あなたは私と共有できる情報は何ですか？ –

質問にプロジェクトに関する情報やコードを追加できますか？ウェブサイトを主催するのはあなたですか？どのようなテクノロジースタックを使用していますか？この[user]（http://stackoverflow.com/a/10008270/6079540）は、彼のユーザエージェントを偽装しなければなりませんでした...そして、あなたはrgx： 'import re;を使ってコードを単純化することができました。 alert = re.findall（r '\ * {3}（。+）\ * {3}'、webContent）[0] ' – dron22

答えて

関連する問題