"Company Name"、 "Company Type"フィールドをHTMLページから抽出する必要があります。私は次のコードを使用して会社名を抽出することができました:Beautiful Soup Pythonを使用して<span>からフィールドを抽出できません
ol1 = soup.find('ol')
company_box = soup.find_all('span', attrs= {'class': 'company-name'})
for ol in ol1:
for c in company_box:
print c.text
私は会社のタイプも抽出したいと思います。 「会社型」が「プライベート」の場合、「はい」を印刷し、そうでない場合は「いいえ」を印刷します。
私は会社の種類を抽出するたびに、空のフィールドを返します。コードブロックは次のとおりです。
for c in company_box:
print c.text
ptype_box = soup.find_all('span', attrs= {'class': 'company-type'})
print ptype_box
基本Webサイトはfortune.com/best-companiesです。助けてください !
サンプル・ページを見てみると、何の '同社-type'が、ページ・ビュー・ソースのどこに存在しない//fortune.com/best-companies/ – mVChr
'同社-type'がは拡大後に発見されますリスト全体。問題は、bs4がフルサイトを通過していないことです。 – ruaridhw