2017-05-20 13 views
0

私はWebスパイダーとして動作しているPython(3.6)スクリプトを持っています。それは、ページのコンテンツをつかんで、リンクを抽出し、それらをクロールします。それは私がそれを実行しながら、反対考え出すことができることを各エラーにカスタム応答を作成しようとしていますモジュール全体をインポートせずにlxmlエラーを処理する方法は?

from lxml import html 

を使用してインポートし、リンクを処理するためにlxml.htmlを使用しています。私は現在、Unicode、SSL、Redirect、Connection、およびContentDecodeのエラーを処理しています。私はlxml.etree.XMLSyntaxErrorlxml.etree.XMLParseErrorにたくさん走っています。私はexcept-blocksを介してそれらを渡そうとしましたが、NameError: name 'lxml' is not definedになると常に停止します。モジュール全体ではなくlxml.htmlをインポートするだけです。

モジュール全体をインポートせずにエラーを捕捉できる方法はありますか?

答えて

0

からlxmlエラーにアクセスすることができます。 etree.XMLSyntaxErrorおよびetree.ParseError

from lxml import etree 

lxmlのもetreeモジュール内のすべてのオブジェクトを詳細a nice pageを有しています。

関連する問題