2016-11-15 6 views
0

私はbeatifulSoupで問題を解決しようとします。 私は私が持っていると思いますどのようなコンテンツBeatifulSoupはコンテンツ内の "•"で応答します

content =""" 
<div class="topinfo title">Kategorie: <b>Serie</b> • Datum: <b>15.11.16</b> • IMDB: <a href="http://dontknow.me/at/?http://www.imdb.com/title/tt0092455/"> 
</div> 
""" 

を持っているが、「データム」フィールドですが、私はカントの仕事です。 私が試した:私は何をあなたの必要性を確認していないが、これは多分仕事

答えて

0

...

soup = BeautifulSoup(content, "html.parser") 
info = {} 
for details in soup.find_all("div", {"class" : "topinfo title"}): 
    info[details.text.strip(':')] = details.next_sibling.strip('\n') 

を私はそれが仕事を得るカント:

アウト
from bs4 import BeautifulSoup 
doc ='''<div class="topinfo title">Kategorie: <b>Serie</b> • Datum: <b>15.11.16</b> • IMDB: <a href="http://dontknow.me/at/?http://www.imdb.com/title/tt0092455/"> 
</div>''' 
soup = BeautifulSoup(doc, 'lxml') 
soup.get_text() 

'Kategorie: Serie • Datum: 15.11.16 • IMDB: \n' 

この点が分かれば、好きなように遊びます。

関連する問題