私はいくつかのhtmlコードを持っていますので、クラス内のいくつかのカテゴリでは小出しとhrefを抽出する必要があります。 HTMLは次のとおりです。beautifoulsoapでhrefとtitleを抽出できません
<div class="submenu_img3" >
<ul class="submenu_list3 visible_false">
<li class="">
<input type="hidden" name="has_subcategories" value="0"/>
<input type="hidden" name="has_thirdlevel" value="0"/>
<input type="hidden" name="level" value="0"/>
<input type="hidden" name="posicion" value="0"/>
<a href="https://www.alimentacion.alcampo.es/tienda/index.php?cPath=2112_13_1302_6511">
<span class="txt" >
Cerdo selecta </span>
</a>
</li>
<li class="">
<input type="hidden" name="has_subcategories" value="0"/>
<input type="hidden" name="has_thirdlevel" value="0"/>
<input type="hidden" name="level" value="2"/>
<input type="hidden" name="posicion" value="1"/>
<a href="https://www.alimentacion.alcampo.es/tienda/index.php?cPath=2112_13_1302_130201">
<span class="txt" >
Cerdo Blanco </span>
</a>
</li>
<li class="">
<input type="hidden" name="has_subcategories" value="0"/>
<input type="hidden" name="has_thirdlevel" value="0"/>
<input type="hidden" name="level" value="2"/>
<input type="hidden" name="posicion" value="2"/>
<a href="https://www.alimentacion.alcampo.es/tienda/index.php?cPath=2112_13_1302_130202">
<span class="txt" >
Cerdo de Teruel </span>
</a>
</li>
<li class="">
<input type="hidden" name="has_subcategories" value="0"/>
<input type="hidden" name="has_thirdlevel" value="0"/>
<input type="hidden" name="level" value="2"/>
<input type="hidden" name="posicion" value="3"/>
<a href="https://www.alimentacion.alcampo.es/tienda/index.php?cPath=2112_13_1302_130203">
<span class="txt" >
Cerdo Ibérico </span>
</a>
</li>
しかし、これらのコードを、私は何かを得るカント:
for row in soup.find_all('div',attrs={"class" : "submenu_img3"}, href=True):
print row.text
print row.a['href']
あなたは私を助けてくださいもらえますか?ありがとう、ごめんなさい。
を非常に強力である'ゼロのアイテムを見つけましたか? – enkryptor
はい、htmlは長いですが、少し断片を抽出しました – defekas17
'href'引数がないとどうなりますか? 'soup.find_all( "div'"。class _ = "submenu_img3") – enkryptor