urllib.request python3.1を使用してHTMLファイルからソースコードを抽出次のコードを実装することで、私はhtmlファイルから正規表現を使用してデータを取得しようとしている
File "extract.py", line 33, in extract_words
match = re.findall("<tr>\s*<td>([\w\s.;'(),-/]+)</td>\s+<td>([\w\s.,;'()-/]+)</td>\s*</tr>", text)
File "/usr/lib/python3.1/re.py", line 192, in findall
return _compile(pattern, flags).findall(string)
TypeError: can't use a string pattern on a bytes-like object
さらにIDLEで実験したところ、uf.read()は最初に呼び出すときに実際にHTMLソースコードを返すことに気付きました。しかしそれ以降、a-b ''が返されます。これを回避する方法はありますか?