私はpythonでHTMLParserとurllib3を使ってWebクローラを作成しようとしています。現在、私は最初はHTMLパーサのインポートの問題
import html.parser
import urllib
urlText = []
#Define HTML Parser
class parseText(HTMLParser.HTMLParser):
def handle_data(self, data):
if data != '\n':
urlText.append(data)
#Create instance of HTML parser
lParser = parseText()
thisurl = "http://www-rohan.sdsu.edu/~gawron/index.html"
#Feed HTML file into parser
lParser.feed(urllib.urlopen(thisurl).read())
lParser.close()
for item in urlText:
print (item)
されている2つの異なる輸入の問題があり、このコードでそれは、Visual Studioのエラーボックスに
name 'HTMLParser' is not defined
をエラーを返し、第二の選択肢はまったく同じですが、輸入HTMLParserであります代わりhtml.parserのエラーを返し
import HTMLParser
import urllib
urlText = []
#Define HTML Parser
class parseText(HTMLParser.HTMLParser):
def handle_data(self, data):
if data != '\n':
urlText.append(data)
#Create instance of HTML parser
lParser = parseText()
thisurl = "http://www-rohan.sdsu.edu/~gawron/index.html"
#Feed HTML file into parser
lParser.feed(urllib.urlopen(thisurl).read())
lParser.close()
for item in urlText:
print (item)
No module named 'markupbase'
私はパッケージで私の心を失っています。誰かが修正を知っているのか、問題があるのか分かりません。 Ps。私はVisual Studio 2016でこれを実行していて、Python 3.5にあります
2番目のサンプルで問題を再現できません。フルトレースバックを表示してください。また、インデントを修正してください。 –