scrapy-spider

12熱

2答えて

私はスクレイピーに新しいです。私はイケアのウェブサイトのウェブページをスクラップしようとしています。場所のリストが与えられたhereの基本ページ。マイitems.pyファイルは以下の通りである： import scrapy class IkeaItem(scrapy.Item): name = scrapy.Field() link = scrapy.Field()

6熱

2答えて

ImportError：Scatterを使用中にwin32apiというモジュールがありません

私はScrapyの新しい学習者です。私はPython 2.7と必要な他のすべてのエンジンをインストールしました。次に、チュートリアルhttp://doc.scrapy.org/en/latest/intro/tutorial.htmlに続いてScrapyプロジェクトを作成しようとしました。クロールステップ私はscrapy crawl dmozを入力した後に、それは私がWindowsを使用してい

8熱

1答えて

スクラムスパイダーのstart_urlsで投稿データを送信する方法

投稿データのみをサポートするウェブサイトをクロールしたいですか？すべてのリクエストの照会パラメータを投稿データに送信します。これを達成する方法は？

9熱

4答えて

Scrapyは、内部URLに従うだけですが、見つかったすべてのリンクを抽出します

Scrapyを使用して特定のWebサイトからすべての外部リンクを取得したいと考えています。次のコードを使用すると、スパイダーは外部リンクもクロールします。 from scrapy.contrib.spiders import CrawlSpider, Rule from scrapy.contrib.linkextractors import LinkExtractor from myproj