python
  • linux
  • raspberry-pi
  • urllib2
  • python-2.x
  • 2016-04-09 21 views 0 likes 
    0

    私はurl lib2で作業しています。私は助けが必要です。 私はウェブサイトから必要な情報を取得するとうまくいきますが、ウェブサイトの情報が変わっても結果は変わりません。私は "キャッシュ"や " lib.close "...私は知らない...誰かがそれで私を助けてくれますか?ありがとうここ 解決策が必要urllib2

    は、コードは次のとおりです。

    import urllib2    
    
    url = 'http://website.com' 
    
    response = urllib2.urlopen(url) 
    webContent = response.read() 
    
    string = webContent.find('***') 
    alert = webContent[string+11:] 
    
    webContent = alert 
    string = webContent.find('***') 
    alert = webContent[:string] 
    alert = alert.replace('</strong>',' ') 
    
    print alert 
    

    答えて

    0

    urllib2のキャッシュを行いません。 HTTPプロキシが含まれているか、サーバー側でキャッシュが行われています。

    応答ヘッダーを確認してください。 X-CacheまたはX-Cache-Lookupは、プロキシ経由で接続されていることを意味します。

    +0

    ありがとう、 私はXキャッシュとXキャッシュの検索を調べて、私のための解決策を見つけることができました... 私はウェブサイト上の情報を変更し、それはすぐに更新されます... あなたは私と共有できる情報は何ですか? –

    +0

    質問にプロジェクトに関する情報やコードを追加できますか?ウェブサイトを主催するのはあなたですか?どのようなテクノロジースタックを使用していますか?この[user](http://stackoverflow.com/a/10008270/6079540)は、彼のユーザエージェントを偽装しなければなりませんでした...そして、あなたはrgx: 'import re;を使ってコードを単純化することができました。 alert = re.findall(r '\ * {3}(。+)\ * {3}'、webContent)[0] ' – dron22

    関連する問題