2017-02-07 11 views
2

入れ子divとその内容を取得しようとしていますが、できません。私はクラス: 'box coursebox'でdivにアクセスしたいです。 source code of required section of pageBeautifulSoupが必要なdivを見つけることができません

response = res.read() 
soup = BeautifulSoup(response, "html.parser")  
div = soup.find_all('div', attrs={'class':'box coursebox'}) 

上記のコードは完全にこのライン作業の前に呼び出しfind_all 8 が存在すべきである場合、0の要素とDIVを与えます。

ありがとうございます!

+0

投稿のURL ......... –

+0

ウェブサイトにそれを変更することができます私の大学のLAN上でのみホストされ、外部からはアクセスできません。投稿された画像は、HTMLの必要な部分を示しています。 –

答えて

0

複数の値を持つ属性の場合、Beautiful Soupはすべての値をリストに入れます。あなたのコードでは、ルックアップをしているときにこれを考慮する必要があります。

おそらくこのようなものでしょうか?

div = soup.find_all('div', class_="box coursebox"}) 

は、より多くの複数値属性に関する情報、およびクラスによって要素を検索の詳細についてはthis sectionのための美しいスープのマニュアルのthis sectionを参照してください。

また、をくださいソースコードを画像として投稿しないでください。

+0

イメージは申し訳ありませんが、次回はやりません。また、上記のソースコードで提案した内容を正確に行っています。ぜひご覧ください。画像はウェブページの必要なHTMLのものであり、掻き取りのために書かれたコードはその下にある。 –

0

変更:

soup = BeautifulSoup(response, "html.parser") 

に:

soup = BeautifulSoup(response, "lxml") 

html.parserが安定していない、あなたはlxml

+0

まだ動作していません –

関連する問題