2016-03-24 15 views
1

URLからHTMLデータを解析するのにBeautifulSoupを使用しようとしています。しかし、私は警告を受け取り続けます:beautifulsoup html.parserエラー

"パーサーは明示的に指定されていないので、私はこのシステムで最も利用可能なHTMLパーサー(" html.parser ")を使用しています。あなたは別のシステム上でこのコードを実行する、または別の仮想環境では、それは別のパーサーを使用して、異なる動作をする場合があり

この警告を取り除くために、この変更:これまで

BeautifulSoup([your markup]) 

BeautifulSoup([your markup], "html.parser") 

    markup_type=markup_type)) 

私は現在

url = "myurl.com" 


page = urllib2.urlopen(url).read() 
soup = BeautifulSoup(page, "html.parser") 

任意のアイデアを持っていますか?

答えて

0

だからBeautifulSoupより良いパーサーを使用することを期待します。 thisをチェックしてください。また、hereに推奨されているパーサーをインストールしてみてください。しかし、ターゲット環境にこれらのパーサがあることを確認する必要もあります。

0

私もその問題を抱えていましたが、私はグーグルではありましたが、それを修正する方法はありませんでしたので、私は警告印刷部分についてコメントしました。私があなたのような問題をどのように解決したかを図を参照してください。警告自体で

if builder.is_xml: 
    markup_type = "XML" 
     else: 
      markup_type = "HTML" 
      #warnings.warn(self.NO_PARSER_SPECIFIED_WARNING % dict(
      #parser=builder.NAME, 
      #markup_type=markup_type)) 

fixed bs4 warning showing problem

+1

画像の代わりにコードを追加してください –

0

、彼らは解決策を提供しています。私はちょうどその声明に従った。第2パラメータ'html.parser'を追加しました。警告が削除されます。

parsed_html = BeautifulSoup(html,'html.parser')