特定の検索エントリを取得し、その結果に関連付けられた.csvファイル全体を保存するクローラを作成しようとしています。Pythonサイトクローラ、Scrapyでファイルを保存する
私は必要なすべてのhtmlデータを解析するために既にスパイダーをログインしていますが、今必要なファイルをどのように保存できるかを把握するだけです。
ので、検索は、Webブラウザで相関.csvファイルを保存するように求められますように、この https://www.thissite.com/data/file_download.jsp?filetype=1&id=22944
などのリンクを返します。このページをロードしてファイルをダウンロードできるようにするには、どのようにしてスパイダーに書き込むことができますか?または、情報への静的リンクを取得する方法はありますか?
URLが返すものを見ると、おそらくリダイレクトです。 – tripleee
リダイレクトではありません。 – howdoicrawlweb