私はlxmlを使ってURLを与えられたhtmlファイルを解析しています。例えばlxmlを使用している場合、httpsについてどうすればいいですか?
:
link = 'https://abc.com/def'
htmltree = lxml.html.parse(link)
私のコードは、ほとんどの場合のためにうまく機能している、http://
を持つもの。しかし、私はすべてのhttps://
のURLを発見した、lxmlはIOErrorを取得します。誰もその理由を知っていますか?そしておそらく、この問題を解決する方法は?
私はすでに完成したプログラムを持っているので、BeautifulSoupに切り替えるよりlxmlに固執したいと思います。
'from urllib.request import urlopen' for python3 –