1
Scrapyを使用して、抽出したURLを使用してバイナリファイルをメモリに読み込んで内容を抽出します。Scrapyを使用してファイルストリームを読み込み用に開くにはどうすればよいですか?
現在のところ、ページのセレクタを使用してURLを見つけることができます。
myFile = response.xpath('//a[contains(@href,".interestingfileextension")]/@href').extract()
このファイルをメモリに読み込むと、そのファイルのコンテンツを探すことができますか?
感謝
パーフェクト。ありがとうございました!治療はとても簡単です。 –