私は、次のしている:Python + BeautifulSoup: 'a'要素の 'href'属性を取得するには?
html =
'''<div class=“file-one”>
<a href=“/file-one/additional” class=“file-link">
<h3 class=“file-name”>File One</h3>
</a>
<div class=“location”>
Down
</div>
</div>'''
そして/file-one/additional
あるhref
のテキストだけを取得したいと思います。だから私はした:
from bs4 import BeautifulSoup
soup = BeautifulSoup(html, 'html.parser')
link_text = “”
for a in soup.find_all(‘a’, href=True, text=True):
link_text = a[‘href’]
print “Link: “ + link_text
しかし、それだけで、何も何も印刷されません。ただLink:
。だから私は別のサイトでそれをテストしましたが、別のHTMLを使ってテストしました。
私は間違っていますか?または、意図的にhref
を返さないようにサイトが設定されている可能性はありますか?
ありがとうございますupvote/answerを受け入れるようにしてください!
実際にあなたのHTMLには中括弧が含まれていますか? – user2357112
そのため、あなたの*コード*に中括弧が入っているのはなぜですか?あなたは何をコーディングしていますか?テキストエディタを使用する必要があります。 – user2357112
パラメータ 'text = True'を削除すると、あなたのコードは私のために機能します – davedwards