-1
私は段落タグの内容を取得するのに混乱します。段落の内容を取得
<div class="SomeID">
<p>What a voice! </p>
</div>
私はこの時点で
list = soup.find_all("div","SomeID")
に達ししかし、どのように段落の内容を取得する。(どのような声!)
基本的な問題から、すべての段落タグの内容を取得することです
import urllib
from bs4 import BeautifulSoup
html = urllib.urlopen('http://www.dawn.com/news/1267272/democracys-woes').read()
soup = BeautifulSoup(html, 'html.parser')
list = soup.find_all("div","comment__body cf")
print list
両方が機能していません。私は質問を更新しています。親切にそれを見て一瞥してください。 –
@AliMurtazaまあ、 'div.comment__body> p'は私のために働く。 – alecxe
それが機能していない: インポートurllibは をBS4インポートBeautifulSoup のhtml = urllib.urlopen( 'http://www.dawn.com/news/1267272/democracys-woes').read() スープ= BeautifulSoupから(html、 'html.parser') #リスト= soup.find_all( "div"、 "comment__body cf") #print list list2 = soup.select_one( "div.comment__body cf> p")。get_text strip = True) 印刷リスト2 –