0
html = urlopen(url)
bs = BeautifulSoup(html.read(), 'html5lib')
を作成する際に立ち往生は、プロセスがBeautifulSoup(html.read(), 'html5lib')
で立ち往生、私は「lxmlの」と「html.parser」にHTMLパーサから変更しようとしています。しかし、問題は解決しません。 BeautifulSoupにバグはありますか?どうすればこの問題を解決できますか?使用BeautifulSoupでHTMLを解析するが、数回実行した後BeatuifulSoupオブジェクト
更新 私はこの
print('open the url')
html = urlopen(url)
print('create BeautifulSoup Object')
bs = BeautifulSoup(html.read(), 'html5lib')
コンソール印刷create BeautifulSoup Object
のように、プログラム内のいくつかのログを追加して、ちょうどカーソルが点滅してそこにとどまります。
さらに詳しい情報が得られれば、エラーやタイムアウトはありますか? – glls
エラーはありません。プログラムはちょうどそこにこだわってしまいます。 – DarkerLuna
最も可能性の高い問題は、実際にはhtml.read()呼び出しでスタックされていて、BeautifulSoupが責任を負わないことです。たぶんあなたの問題が本当にBeautifulSoupであることを確認するために、html.read()を引き出してください。 –