私はウェブスクレイピングプロジェクトに取り組んでおり、スピードに問題がありました。それを修正しようとすると、html.parserの代わりにlxmlをBeautifulSoupのパーサとして使用したいと考えています。私はこれを行うことができました:lxmlをデフォルトとして設定BeautifulSoupパーサー
soup = bs4.BeautifulSoup(html, 'lxml')
が、私は繰り返し、私はBeautifulSoupを呼び出すたびに'lxml'
入力する必要がありますする必要はありません。プログラムの最初に一度使用するパーサーを設定する方法はありますか? Specifying the parser to useドキュメントページによると
'lxml'は*あなたは' lxml'がインストールされていると仮定すると、* bs4' 'のデフォルトです。だからあなたがBeautifulSoup3で作業している場合を除いて... – roippi
私はbs4を使用していますが、私が現在どのパーサーを使用しているかを確認する方法はわかりませんでした。ありがとうございました! –