2016-08-04 7 views
1

を使用して、私は、Pythonを学んだし、私はPHPがBeautifulSoupを使って作られたWebページを解析しようとしています。私の問題は、このエラー私のスクリプトのショーです:未定義のインデックス:HTTP_ACCEPT_LANGUAGE BeatifulSoup/Pythonの

<div style="border:1px solid #990000;padding-left:20px;margin:0 0 10px 0;"> 
<h4>A PHP Error was encountered</h4> 
<p>Severity: Notice</p> 
<p>Message: Undefined index: HTTP_ACCEPT_LANGUAGE</p> 
<p>Filename: hooks/detecta_idioma.php</p> 
<p>Line Number: 110</p> 
</div> 

私はこの

html = urllib.urlopen(url).read() 
web = BeautifulSoup(html,'html.parser') 
print web 
etiquetas = web('a') 

を実行しようとするとき、私は、コマンドラインで私のスクリプトを実行する代わりに、Webブラウザを使用しますが、実行するためにこのエラーと考えこのスクリプトはApacheから、私は同じエラーがあります。私はそのURLを解析するために定義することができますどのように

誰もが知っていますか?ページリクエストと一緒に渡されたAccept-Languageヘッダーを持ってする必要がありますように

答えて

0

が見えます。ここでrequestsであることを行う方法の例です:

import requests 

url = "my url" 

response = requests.get(url, headers={"Accept-Language": "en-US,en"}) 
html = response.content 
web = BeautifulSoup(html, 'html.parser')