2017-08-13 17 views
1

soup.get_text()コマンドでスクリプトが作成され、エラーが見つかりました。 コード:BeautifulSoup:HTMLファイルを解析中にタイプエラーが発生しました

from BeautifulSoup import * 
soup=BeautifulSoup(open("F:\\HTML\\Registrationform.html")) 
print soup.get_text('+') 

エラー:ファイル "C:/Python27/beautifulsoup4-4.6.0.tar/scrapingbasic.py"、3行目、

print soup.get_text('+') 
TypeError: 'NoneType' object is not callable 
+0

更新 – SmartManoj

答えて

1

BeautifulSoupクラスでは、コンストラクタでhtml/xml内容を期待しています。あなたのopen関数に.read()を追加するとうまくいくはずです。 は、ここでは、コードです:また

from BeautifulSoup import * 
soup=BeautifulSoup(open("F:\\HTML\\Registrationform.html").read()) 

print soup.get_text('+') 

、私はあなたがBeautifulSoup4にアップグレードすることをお勧めします。

これが役に立ちます。

0

BeautifulSoupはhtml/xmlドキュメントを期待しています。 Python 2.xがあなたのhtmlファイルを解析できるかどうか確認してください。ちょうど再チェックのためです。ウィンドウで別の問題が発生する可能性があり、lxmlライブラリが正常にインストールされていることを確認する必要があります。 [beautifulsoup4](https://www.crummy.com/software/BeautifulSoup/bs4/doc/)に

from bs4 import BeautifulSoup 
with open("index.html") as fp: 
    soup = BeautifulSoup(fp) 
+0

次のセクションでhttps://www.crummy.com/software/BeautifulSoup/bs4/doc/

:また、あなたからのドキュメントを再確認することができますprint soup.get_text( '+')を正常に実行します。 ありがとうございます。 –

関連する問題