注: bs4とlxmlはオプションではないので、サードパーティのモジュールを使用することはできません。
xml.minidomが壊れたXMLを解析できるか
Python 3 std libでHTMLを解析する必要があります。私はxml.minidomが行く方法だと思ったが、構文エラーのような例外をスローせずに無効なXML/HTMLを解析することはできないようだ。
xmlモジュール内で何か探しているものが見つからないのですか?
私はstdライブラリで何かを見逃していますか?あなたが壊れたHTML/XMLを処理する必要がある場合
私が言ったように、私はbs4や他のサードパーティのモジュール –