0
実際に私が読んでいるURLをURLを読んで、私は読んで、PythonでそのURLを開き、ループの中で、これはBAD応答の出力を与える400Pythonは行ごとに1つのURLを含むファイルからファイルから
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN""http://www.w3.org/TR/html4/strict.dtd">
<HTML><HEAD><TITLE>Bad Request</TITLE>
<META HTTP-EQUIV="Content-Type" Content="text/html; charset=us-ascii">
</HEAD>
<BODY><h2>Bad Request - Invalid URL</h2>
<hr><p>HTTP Error 400. The request URL is invalid.</p>
</BODY></HTML>
#$#$#$#$#$#$#$#$#$#$#$#
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN""http://www.w3.org/TR/html4/strict.dtd">
<HTML><HEAD><TITLE>Bad Request</TITLE>
<META HTTP-EQUIV="Content-Type" Content="text/html; charset=us-ascii">
</HEAD>
<BODY><h2>Bad Request - Invalid URL</h2>
<hr><p>HTTP Error 400. The request URL is invalid.</p>
</BODY></HTML>
#$#$#$#$#$#$#$#$#$#$#$#
これは2つのURLの出力です。
しかし、ファイルにURLを1つだけ追加すると、それが正常に読み込まれ、実際のHTMLページが出力されます。 (でも、ループ内)
ここでのpythonの私のコード
import time
import cfscrape
scraper = cfscrape.create_scraper()
f = open('links.txt')
f2 = open('pages.html','a')
for line in iter(f):
line2 = line
page = scraper.get(line2).content
f2.write(page)
f2.write("#$#$#$#$#$#$#$#$#$#$#$#")
time.sleep(30)
f.close()
f2.close()
、ここでは、ファイルが
http://kissmanga.com/Manga/Mekakushi-no-Kuni
http://kissmanga.com/Manga/Gigi-Goegoe
に
line2 = line
を変更しようと含まれていlinks.txtリンク/ URLですグレート感謝、それは問題を解決しました。 :) 驚くばかり –