2016-07-28 7 views
0

実際に私が読んでいるURLをURLを読んで、私は読んで、PythonでそのURLを開き、ループの中で、これはBAD応答の出力を与える400Pythonは行ごとに1つのURLを含むファイルからファイルから

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN""http://www.w3.org/TR/html4/strict.dtd"> 
<HTML><HEAD><TITLE>Bad Request</TITLE> 
<META HTTP-EQUIV="Content-Type" Content="text/html; charset=us-ascii"> 
</HEAD> 
<BODY><h2>Bad Request - Invalid URL</h2> 
<hr><p>HTTP Error 400. The request URL is invalid.</p> 
</BODY></HTML> 
#$#$#$#$#$#$#$#$#$#$#$# 
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN""http://www.w3.org/TR/html4/strict.dtd"> 
<HTML><HEAD><TITLE>Bad Request</TITLE> 
<META HTTP-EQUIV="Content-Type" Content="text/html; charset=us-ascii">  
</HEAD> 
<BODY><h2>Bad Request - Invalid URL</h2> 
<hr><p>HTTP Error 400. The request URL is invalid.</p> 
</BODY></HTML> 
#$#$#$#$#$#$#$#$#$#$#$# 

これは2つのURLの出力です。

しかし、ファイルにURLを1つだけ追加すると、それが正常に読み込まれ、実際のHTMLページが出力されます。 (でも、ループ内)

ここでのpythonの私のコード

import time 
import cfscrape 
scraper = cfscrape.create_scraper() 
f = open('links.txt') 
f2 = open('pages.html','a') 
for line in iter(f): 
    line2 = line 
    page = scraper.get(line2).content 
    f2.write(page) 
    f2.write("#$#$#$#$#$#$#$#$#$#$#$#") 
    time.sleep(30) 
f.close() 
f2.close() 

、ここでは、ファイルが

http://kissmanga.com/Manga/Mekakushi-no-Kuni 
http://kissmanga.com/Manga/Gigi-Goegoe 

答えて

1

line2 = line.strip()

+0

line2 = lineを変更しようと含まれていlinks.txtリンク/ URLですグレート感謝、それは問題を解決しました。 :) 驚くばかり –

関連する問題