2016-08-15 4 views
0

私はrequests.get()に問題があります。 私はここのようにコードに手動でURLを貼り付けた場合:requests.getが<!doctype>を返す<Response>

r = requests.get('https://berlin.kauperts.de/Strassen/Igelsteig-12557-Berlin.html') 
print(r) 

私が取得:<Response [200]>。これはかなりうまくいく。私はのようにファイルのリストのうちのリクエストをお願いしよう 代わり場合:

indir = '/home/d/Desktop/civiv_hacking/Streetnames/dump/berlin.kauperts.de/Strassen' 
for root, dirs, filenames in os.walk(indir): 
    for z in filenames: 
    x = urlparse.urljoin('https://berlin.kauperts.de/Strassen/', z+'/'), 
    [t[0] for t in x], 
    print(t), 
    for r in requests.get(t):    
     print(r), 

私が取得:https://berlin.kauperts.de/Strassen/Igelsteig-12557-Berlin/ <!DOCTYPE html> <html lang="de" xml:lang="de" xmlns="http://www.w3.org/1999/xhtml"> はどのように私はrequests.get()<Response [200]>だけではなくDOCTYPE情報を返すことができますか?

答えて

1

あなたはResponse文字列表現を見たい場合は、あなたがそれを反復すべきではない、ちょうど印刷:

url = urlparse.urljoin('https://berlin.kauperts.de/Strassen/', z) 
response = requests.get(url) 
print(response) # would print "<Response [200]>" 
関連する問題