2016-10-04 16 views
-1

HTMLの内容をPythonで読み込もうとしています。 URLHTMLの内容を取得するには、モジュールwget,urllibまたは別のモジュールを使用しますか?PythonのURLからHTMLを取得する

回答: urllibモジュールはデフォルトのPython 2.7ビルドに付属していますので、このコンピュータから外部モジュールをダウンロードすることはできません。 URLの内容を取得するモジュールの

一覧:ここで

Wget 
Beautiful Soup 
Urllib 
Requests 
+0

あなたは 'BeautifulSoup'を試みたことがありますか? –

+0

はい。複数の選択肢(リストにリクエストを追加)があり、いずれかを使用することができます。 – tdelaney

+0

あなたが試したことを私たちに見せてもらえますか?このサイトには、このトピックに関する多くの質問と回答があります。あなたは特定の質問がありますか? – MooingRawr

答えて

2

はあなたがrequestsを始めるためのサンプルです:

import requests 

resp = requests.get('http://httpbin.org/get') 
if resp.ok: 
    print (resp.text) 
else: 
    print ("Boo! {}".format(resp.status_code)) 
    print (resp.text) 
+0

これは最も簡単です。 Python3.xを使用している場合は、 'print resp.text'を' print(resp.text) 'に置き換えてください。 –

+0

脇に:http://httpbin.orgは、クライアントをテストするための優れたリソースです。 –

+0

ありがとう、@ 345243lkj - サンプルとコメントを修正しました。 –

関連する問題