Webページからurllib2を使ってhtmlタグの間に805の数字を入れたいと思います。ここでpython 2 urllib2の応答結果から中国語の文字数を取得
<span class="count">(共805张)</span>
は、私が数を取得するために書いたPythonコードです:
url = "https://movie.douban.com/celebrity/1044996/photos/"
request = urllib2.Request(url,headers=headers)
response = urllib2.urlopen(request)
content = response.read().decode('utf-8')
pattern1 = re.compile(r'<span\sclass="count">(.*?)</', re.S)
result1 = re.search(pattern1, content)
total_num = result1.group(1)
total_num = total_num
をしかし、私はTOTAL_NUMを印刷するとき、コンソールは示しています
u'(\u5171805\u5f20)'
どのように私は数を得ることができます805は正規表現の使用を期待していますか?