私はscrapyをインストールして、単純なdmoz tutorialに従っています。私はPythonの基本的なファイル処理を調べて、ファイルからURLのリストを読み込むようにクローラを取得しようとしましたが、いくつかのエラーがありました。これはおそらく間違っているが、私はそれを撃った。誰かが私にURLのリストを読んでいる例をスクレイピーに見せてもらえますか?前もって感謝します。Scrapyは、ファイルからスクレイプまでのURLのリストを読み取りますか?
from scrapy.spider import BaseSpider
class DmozSpider(BaseSpider):
name = "dmoz"
allowed_domains = ["dmoz.org"]
f = open("urls.txt")
start_urls = f
def parse(self, response):
filename = response.url.split("/")[-2]
open(filename, 'wb').write(response.body)
'readlines()は'各ラインの終わりに改行を保持します。改行を 'strip()'してファイルを閉じる編集を提出しました。 –