2017-10-10 9 views
0

を得ることができない私は、韓国のサイト名dcinsideからHTMLコードを取得しようとした私は、リクエストを使用していますが、HTMLコードPythonの要求は、HTML

を取得し、これは私のコード

import requests 
url = "http://gall.dcinside.com/board/lists/?id=bitcoins&page=1" 
req = requests.get(url) 
print (req) 
print (req.content) 

が、結果であることはできません私もリクエストを使用してHTMLコードを取得することはできませんなぜ

enter image description here

でした?

答えて

1

はこれを見てください:

  1. Python Web Crawlers and "getting" html source code

男は、前述の記事で言ったように、あなたは簡単にWebリソースを得ることができるようになるurllib2を使用する必要があります。

+0

「urllib2」を使用していると、OPが取得しようとしているWebサイトで動作していないようです。 – ritiek

2

ほとんどの場合、データを動的にクロールしようとしていて、応答としてコンテンツを提供していないことが検出されている可能性があります。ブラウザで、ふつうUser-Agentヘッダーを渡しているようなふりをしてみてください。

headers = { 
    'User-Agent': 'My User Agent 1.0', 
    'From': '[email protected]' 
} 

response = requests.get(url, headers=headers) 

# use authentic mozilla or chrome user-agent strings if this doesn't work