http://www.emoryhealthcare.org/locations/offices/advanced-digestive-care-1.htmlから情報をスクラップしようとしています。BeautifulSoupがすべての要素をプルしない
「消化器」と「内科」のページの下3分の1に表示される専門医を掻き集めたいと思います。要素を調べると、li
が<div class="module bordered specialist">
であることがわかりましたが、スープをループして見つけた各項目を印刷しようとすると、予想外の結果が返されます。
<div class="module bordered specialist">
<ul>
<li>Cardiac Care</li>
<li>Transplantation</li>
<li>Cancer Care (Oncology)</li>
<li>Diagnostic Radiology</li>
<li>Neurosciences</li>
<li>Mental Health Services</li>
</ul>
</div>
ブラウザでウェブサイトを開くと、コンテンツが予期される結果に切り替わる前に、上記の値が点滅することがわかります。私が意図しているアイテムをこすってしまう可能性を改善する方法はありますか?
ページの読み込み後にコンテンツを変更するjavascriptがあるようです。 –
'selenium'を使用して数秒待つことができます(変更にかかる時間はどれくらいですか)。 –