私は、Webからのデータをこすると、タグ「のdiv」とクラスを持つすべての要素を削除しようとしているが、以下に、このHTMLのような「モジュールをノート」:取り外し要素とPython 3
<div class="notes module" role="complementary">
<h3 class="heading">Notes:</h3>
<ul class="associations">
<li>
Translation into Русский available:
<a href="/works/494195">Два-два-один Браво Бейкер</a> by <a rel="author" href="https://stackoverflow.com/users/dzenka/pseuds/dzenka">dzenka</a>, <a rel="author" href="https://stackoverflow.com/users/La_Ardilla/pseuds/La_Ardilla">La_Ardilla</a>
</li>
</ul>
<blockquote class="userstuff">
<p>
<i>Warnings: numerous references to and glancing depictions of combat, injury, murder, and mutilation of the dead; deaths of minor and major original characters. Numerous explicit depictions of sex between two men.</i>
</p>
</blockquote>
<p class="jump">(See the end of the work for <a href="#children">other works inspired by this one</a>.)</p>
</div>
ソースはこちらです:view-source:http://archiveofourown.org/works/180121?view_full_work=true
私は削除したい要素を見つけて印刷することにも苦労しています。これまでのところ私は持っています:
import urllib.request, urllib.parse, urllib.error
from lxml import html
from bs4 import BeautifulSoup
url = 'http://archiveofourown.org/works/180121?view_full_work=true'
html = urllib.request.urlopen(url).read()
soup = BeautifulSoup(html, 'lxml')
removals = soup.find_all('div', {'id':'notes module'})
for match in removals:
match.decompose()
しかし、除去は空のリストを返します。上に示したdiv要素全体を選択して、htmlからそのような要素をすべて選択して削除することができますか?
ありがとうございます。
ありがとうございました。私はまだ空リストを取得しています。 – SBlack