2016-08-08 9 views
0

Python Web Scraping With Python Ryan Mitchell著、中国語版p23。他の人が類似しているとわかります。修正方法を教えてください。前もって感謝します。 私は画像を掲載しました。次のようにコード:BeautifulSoup、TypeError: 'NoneType'オブジェクトは呼び出し可能ではありません。本から:Web Scraping With Python

from urllib.request import urlopen 
from bs4 import BeautifulSoup 
import re 

html = urlopen("http://www.pythonscraping.com/pages/page3.html") 
bsObj = BeautifulSoup(html,"html.parser") 
images = bsObj.findALL("img",{"src":re.compile("\.\.\/img\/gifts\/img.*\.jpg")}) 
for image in images: 
    print(image["src"]) 
+0

テキスト*としてここに*を記入してください。 –

+0

毎週「正規表現でHTMLを解析しようとしています」という質問。 – DeepSpace

+0

ここで質問を更新してください。 –

答えて

1

それはそれはfindAllのとして*find_all*を使用するfindAllまたはより良い、つまりL'sの小文字である必要があり、実際に*findALL*では推奨されません。:

あなたを与えるだろう
images = bsObj.find_all("img",{"src":re.compile("\.\./img/gifts/img.*\.jpg")}) 

../img/gifts/img1.jpg 
../img/gifts/img2.jpg 
../img/gifts/img3.jpg 
../img/gifts/img4.jpg 
../img/gifts/img6.jpg 

../img/gifts/imgとE他の画像は、そのパスにあなたは彼らのSRC属性に /IMG /ギフト/ IMGを持っていたイメージを検索するための正規表現の代わりにCSSセレクタを使用することができます。

images = bsObj.select("img[src*=../img/gifts/img]") 
+0

ありがとうございました。 –

関連する問題