2017-03-07 10 views
1

とデスクトップからHTMLの解析:私は、Webからのソースコードをコピーしている私は何をやったプロキシで問題が発生していますよう http://www.smv.gob.pe/Frm_ValorCuotaDetalle_V2.aspx?in_ac_pre_ope=A&in_ad_fecha=31/01/2017私はこの ウェブサイトからの情報を充電する必要があるとしましょうパイソン

しかし、とtest222.htmlという名前のメモ帳ファイルに貼り付けました。

私はそれを操作するために美しいスープでそれを読んでいますが、私は本当にそれを行う方法を知っていません。 test222.htmlのドキュメントは私のデスクトップにあります。今の私が持っている すべてのコードはこれです...事前に

from bs4 import BeautifulSoup 

web_parsed = 'C:/Users/Desktop/test222.html' 

soup = BeautifulSoup(web_parsed, 'html.parser') 

print soup 

おかげ

答えて

3

BeautifulSoupは、HTML文字列を期待し、あなたは最初のファイルを読み込む必要があります。

with open(r'C:/Users/Desktop/test222.html') as f: 
    html = f.read() 

soup = BeautifulSoup(html , 'html.parser') 
print soup 
関連する問題