2017-03-05 4 views
2

このWikipedia pageには2つの参照エラーが含まれています。あなたは、要素の検査時に、特定のスパンクラス、すなわち<span class="error mw-ext-cite-error"を抽出する必要があることがわかります。コピーを得るにはどうすればいいですか? ウィキペディアのページのBS4で特定のスパンクラスをフィルタリングする方法は?

<span class="error mw-ext-cite-error「データの外側のHTMLの次のコードは、すべての <span class>データを提供します。

from bs4 import BeautifulSoup 
import requests 
import csv 

getUrl= 'https://ta.wikipedia.org/s/h6h' 
url = getUrl 
content = requests.get(url).content 
soup = BeautifulSoup(content,'lxml') 
heading = soup.title 
print(heading.text) 
#to get the specific li-interwiki-ta tag<span class="error mw-ext-cite-error" 
refError = soup.findAll ('span') 
print (refError) 

どのように私は、フィルタリングして、特定の<span class="error mw-ext-cite-errorデータということで入手できますか?

答えて

1

あなたは、特定のフィルタリングすることができます次のようにして要素を反復処理します。

refError = soup.findAll('span', { 'class': 'mw-ext-cite-error'}) 
for error in refError: 
    print error 
関連する問題