This questionは4年前に尋ねられましたが、答えは現在BS4のために古くなっています。 美しいスープを使ってHTMLファイルのコメントをすべて削除します。 BS4は、各comment as a special type of navigable stringを作るので、私はこのコードが動作するだろうと思った: for comments in soup.find_all('comment'
私はBeautiful Soup 4を使用して、インターネットから盗んだHTML形式のテキストを解析しています。時にはこのテキストは単に一部のウェブサイトへのリンクです。 BS4は非常にクロス程度であるという事実: UserWarning: "http://example.com" looks like a URL. Beautiful Soup is not
an HTTP client. Y