2
比較的新しいBeautifulSoupが新しく追加されました。ローカルに保存されたhtmlファイルから生のhtmlを取得しようとしています。私は周りを見回し、私はおそらくこれのために美しいスープを使用すべきであることを発見しました。しかし、私がこれを行うとき:BeautifulSoupを使用してローカルに保存されたhtmlファイルから生のHTMLを抽出する
from bs4 import BeautifulSoup
url = r"C:\example.html"
soup = BeautifulSoup(url, "html.parser")
text = soup.get_text()
print (text)
空の文字列が印刷されます。私はいくつかのステップを欠場していると思います。正しい方向へのどんな振る舞いも非常に高く評価されます。