2017-01-18 11 views
1

私はBeautifulSoupを使用して、Webサイトの多くのページでコメントを削っています。このウェブサイトの各ページには、コメント「[[commentMessage]]」があります。この文字列をフィルタリングして、コードが実行されるたびに印刷しないようにしたい。私は非常にPythonとBeautifulSoupには新しいですが、私は間違ったことを探しているかもしれませんが、少し探してからこれを見つけることができませんでした。助言がありますか?私のコードは以下の通りです:python/BeautifulSoupでprint文から1つの文字列を取り除く

from bs4 import BeautifulSoup 
import urllib 
r = urllib.urlopen('website url').read() 
soup = BeautifulSoup(r, "html.parser") 
comments = soup.find_all("div", class_="commentMessage") 
for element in comments: 
    print element.find("span").get_text() 

コメントのすべてが不要なコメント「[[commentMessage]]」を含め、クラスcommentMessageのdivタグ内のスパンです。

答えて

0

シンプルしばらくの間、JavaScriptを学習した後

for element in comments: 
    text = element.find("span").get_text() 
    if "[[commentMessage]]" not in text: 
     print text 
+1

を行う必要がある場合、Pythonはあまりにも簡単なようです!それはトリック、感謝Bahromをした! – Vurolock

+0

ああ、Pythonの素晴らしい:D @Vurolock – Bahrom

関連する問題