これは他の多くのSOの投稿にかなり近いと思いますが、私はこれらの質問と私が見ている問題への答えを調整するのに問題があります。BeautifulSoupは空のリストを返します - 他のパーサーがPythonのエラーを引き起こしています
下記のコードを実行すると、BeautifulSoupが[]
を返しています。私はSOの情報を探していて、この記事でパーサーと既知のバグについて語っています:Html parsing with Beautiful Soup returns empty list MacBook Proの上
Couldn't find a tree builder with the features you requested: lxml.
私は、Python 2.7.10を使用しています:私は他のパーサーをしようとすると、しかし、私はエラーを取得します。誰かが異なるパーサを動作させる方法を知っていますか?あるいはパーサが問題であっても?サイト自体はdiv
タグにクラス名を割り当てていないので、以下は何かを返す試みです。 は、ページ上の何<div>
タグが存在しないため
import urllib2, base64, csv
from bs4 import BeautifulSoup
request = urllib2.Request("http://www.oklahomacounty.org/assessor/Searches/AN-R_HistoricalView.asp?Accountno=R120682380")
result = urllib2.urlopen(request)
soup = BeautifulSoup(result.read(), 'html.parser')
div=soup.findAll('div')
print div
'あなたが要求した機能を持つツリービルダーを見つけることができませんでした:lxml.' - ' lxml'ライブラリがインストールされていないようなエラーです。 – yeputons
ウェブサイトで「div」クラスが割り当てられていない場合、なぜそれが空のリストではなく何かを返すと期待していますか? –
サイトは 'div'タグを使用していますが、タグ内に' class name'属性はありません。 –