AttributeError： 'NoneType'オブジェクトに、Python 2.7でBeautifulSoupを使用した属性 'find'がありません。

-2

私はちょうどpythonのクロールを開始し、1ヶ月間Webテキストをクロールしようとしました。私はpython 2.7.13でこのコードを試しました。AttributeError： 'NoneType'オブジェクトに、Python 2.7でBeautifulSoupを使用した属性 'find'がありません。

class IEEECrawler: 
    def __init__(self): 
     self.baseUrl = "http://ieeexplore.ieee.org" 
     self.targetUrl = "http://ieeexplore.ieee.org/xpl/mostRecentIssue.jsp?reload=true&filter%3DAND%28p_IS_Number%3A4359286%29&rowsPerPage=100&pageNumber=1&resultAction=REFINE&resultAction=ROWS_PER_PAGE&isnumber=4359286#1.html" 
     self.soup = BeautifulSoup(urllib.urlopen(self.targetUrl).read(), "lxml") 
     self.doc_list = self.soup.find_all('div', {'class': "txt"}) 
     self.subUrl = [] 

    def crawlOriginalPage(self): 
     file = open("./result.txt", "w") 
     for doc in self.doc_list: 
      head = doc.find("h3") 
      author_list = '' 
      for author in doc.find_all("div", {'class':"authors"}): 
       for tt in author.find_all('span', {'id':"preferredName"}): 
        author_list += tt['data-author-name'] + ";" 
      author_list = author_list[:-1] 
      file.write(head.find("span").text + ';') 
      file.write(author_list.strip() + ';') 
      file.write(self.baseUrl+head.find('a')['href']+ ';') 
      file.write(doc.find("div", {'class': "hide abstract RevealContent"}).find("p").text.replace('View full abstract'+'»'.decode('utf-8'),'').strip()+ '\n') 
     file.close() 
     print 'finish'

しかし、今日、このコードを再度実行しましたが、このエラーマスジエでは動作しません。私はどのコードを修正すべきか理解できません。

file.write(doc.find("div", {'class': "hide abstract RevealContent"}).find("p").text.replace('View full abstract'+'»'.decode('utf-8'),'').strip()+ '\n')

ちょうど方法find（2あります）を探し、その前に来るものかを確認します

Traceback (most recent call last): 
    File "/Users/user/Downloads/ieee_fin/ieee.py", line 35, in <module> 
    crawler.crawlOriginalPage() 
    File "/Users/user/Downloads/ieee_fin/ieee.py", line 29, in crawlOriginalPage 
    file.write(doc.find("div", {'class': "hide abstract RevealContent"}).find("p").text.replace('View full abstract'+'»'.decode('utf-8'),'').strip()+ '\n') 
AttributeError: 'NoneType' object has no attribute 'find'

出典

2017-02-15 Jiyoun Lim

'doc'はnullです。なぜデバッグするかを調べる。 – Carcigenicate

エラーはあなたの行を示しています。

多分これは悪いです：

doc.find(...)

docがdocがNoneたことを意味するタイプNoneType、だったことを意味することになります。

それとも、これは悪いです：doc.find(...class...)はNoneを返していることを意味する

doc.find("div", {'class': "hide abstract RevealContent"}).find("p")

。おそらくそれは何も見つけることができなかったためです。

結論として、try...exceptラッパーをそのコードの周りに置くか、少し分解してNoneのチェックを開始する必要があります。

出典

2017-02-15 01:27:51

ありがとう、オースティン。あなたのコメントは本当に役に立ちます。私は後でそれについて試して投稿します。 –

AttributeError： 'NoneType'オブジェクトに、Python 2.7でBeautifulSoupを使用した属性 'find'がありません。

答えて

関連する問題