-1
私はHTMLページを比較する簡単なプログラムを書いていますが、現在のボトルネックはHTMLファイルを読み込んでいます。特にコード:なぜurllib2は読みに時間がかかりますか?
htmldata1 = urllib2.urlopen(url1).read()
htmldata2 = urllib2.urlopen(url2).read()
URLはIMDBからのものです。私はなぜそれが(平均約9秒)かかるように長いか分からない。 htmlテキストを正規表現で検索したい場合は、イメージをダウンロードしている可能性があります。私はurllib2を一度も使用していないので、どんな助けもありがたいです。
編集:
私が使用例のURLは、ページが(サーバの終わりに)ロードするだけで、超遅いです
"http://www.imdb.com/title/tt0944947/fullcredits?ref_=tt_cl_sm#cast"
他の人はそれを試してみると、彼らが経験するかどうかを見ることができるようにあなたは、実際のURLを与えることができればそれはいいだろう同じ行動。 – Eduardo
'urllib2'ではなく' urllib'を使って試してみましたか? –
@EduardoはサンプルURLを与えたばかりです。私の悪い。 Abien、この問題はurllibとurllib2の両方で解決されました。 – jman