ページをスクラップし、最初の列からすべてのURLを取得しようとしています。私がテキストとして呼び出すとき、私はdiv内のすべてを取得します。しかし、具体的にURLをターゲットにすると、最初のものしか取得できません。どのように私はそれらのすべてを取得する - ストレージのために分離?なぜpythonとBS4は特に呼び出されたときに1つの 'href'しか返さないのですが、テキストとして呼び出されるとすべての値は返されますか?
from bs4 import BeautifulSoup
from urllib import urlopen
base_url = "http://www.heavyliftpfi.com/news/"
html = urlopen(base_url)
soup = BeautifulSoup(html.read().decode('latin-1', 'ignore'),"lxml")
main_div = soup.select_one("div.fullWidth")
div_sub = main_div.select_one("div.leftcol")
print (div_sub).text # I get that this gets everything as .text
print (div_sub).h2.a['href'] # alternate - with only one 'href' return