1
私はBeautifulSoupを使用して、Webサイトの多くのページでコメントを削っています。このウェブサイトの各ページには、コメント「[[commentMessage]]」があります。この文字列をフィルタリングして、コードが実行されるたびに印刷しないようにしたい。私は非常にPythonとBeautifulSoupには新しいですが、私は間違ったことを探しているかもしれませんが、少し探してからこれを見つけることができませんでした。助言がありますか?私のコードは以下の通りです:python/BeautifulSoupでprint文から1つの文字列を取り除く
from bs4 import BeautifulSoup
import urllib
r = urllib.urlopen('website url').read()
soup = BeautifulSoup(r, "html.parser")
comments = soup.find_all("div", class_="commentMessage")
for element in comments:
print element.find("span").get_text()
コメントのすべてが不要なコメント「[[commentMessage]]」を含め、クラスcommentMessageのdivタグ内のスパンです。
を行う必要がある場合、Pythonはあまりにも簡単なようです!それはトリック、感謝Bahromをした! – Vurolock
ああ、Pythonの素晴らしい:D @Vurolock – Bahrom