2017-03-13 12 views
0

ローカルに保存されたウェブページのコピーを解析しようとすると、beautifulsoupは私に馬鹿馬鹿しく返します。なぜ私はこの問題に直面していないので、タスクを掻き集めるためにリクエストとbs4モジュールを一緒に使用すると、理解できません。bs4はローカルに保存されたhtmlページを正しく開けません

は、ここでは、このコードは、私のコード

import requests 
from bs4 import BeautifulSoup as BS 
import os 

url_2 = r'/Users/davidferreira/Documents/coding_2/ak_screen_scraping/bmra/' 


os.chdir(url_2) 
f = open('re_2.html') 
soup = BS(url_2, "lxml") 
f.close() 

print soup 

だ次の値を返します。

<html><body><p>/Users/davidferreira/Documents/coding_2/ak_screen_scraping/bmra/</p></body></html> 

私はそれをここに掲載しましたので、オンラインでも同様の問題を見つけることができませんでした。どんな助けでも大変に感謝します。

答えて

0

パス(名前はurl_2)をBeautifulSoupに渡しているため、ウェブページのテキストとして処理して返します。最小限のHTMLですっきりとラップします。良いと思われる。

ファイルの内容からBSを構築するようにしてください。それがどのように機能するかをここで参照してください:

soup = BS(f) 

...

+0

多くの感謝を行う必要があります! @flaschbier – AndrewF

関連する問題