美しいスープモジュールを使用して、feeditemcontent cxfeeditemcontent
のdiv
タグのデータを取得するにはどうすればよいですか?それは次のとおりです。美味しいスープを使ってクラス名と内容を取得
soup.class['feeditemcontent cxfeeditemcontent']
か:
<div class="feeditemcontent cxfeeditemcontent">
<div class="feeditembodyandfooter">
<div class="feeditembody">
<span>The actual data is some where here</span>
</div>
</div>
</div>
と、これはPythonのコードです:
from BeautifulSoup import BeautifulSoup
html_doc = open('home.jsp.html', 'r')
soup = BeautifulSoup(html_doc)
class="feeditemcontent cxfeeditemcontent"
'class = dict(tag.attrs).get( 'class'、 '')'は 'try'' except'ブロックよりもずっと短く、機能は同じです。 –
@DoronCohenは 'dict()'が必要ですか?せずに働くと思われる。 – Mark
@マークこれは 'TypeError:list indicesはstrではなく、整数でなければならないリストなので、' dict() 'なしで例外が発生します。また、この答えはBeautiful Soup 3(別の結果が表示されている理由かもしれない)を前提としています。バージョン4を使用していて、他の回答を使用しているはずです。 – jadkik94