私はhereからの結果をスクラピーで削り取ろうとしています。問題は、「結果をもっと読み込む」タブがクリックされるまで、すべてのクラスがページに表示されないことです。どのように私はScrapyの次のページにジャンプすることができます
問題はここで見ることができます:
私のコードは次のようになります。
class ClassCentralSpider(CrawlSpider):
name = "class_central"
allowed_domains = ["www.class-central.com"]
start_urls = (
'https://www.class-central.com/courses/recentlyAdded',
)
rules = (
Rule(
LinkExtractor(
# allow=("index\d00\.html",),
restrict_xpaths=('//div[@id="show-more-courses"]',)
),
callback='parse',
follow=True
),
)
def parse(self, response):
x = response.xpath('//span[@class="course-name-text"]/text()').extract()
item = ClasscentralItem()
for y in x:
item['name'] = y
print item['name']
pass
2ページ目のURLはどのように見えますか?そのような場合www.website.com/Recently_Added/2それは本当に簡単な解決策になります。または、実際には、より多くの結果をロードするように表示されるデータを取得しようとしていますか? – SAMO
それは動作しません。私は2ページ目のURLを取得する方法や[次のURLをロードする]を呼び出す方法がわかりません – Yato
これは単なる例に過ぎません。URLが明らかに変化したら、それを悪用する可能性があります。そして、大丈夫ですので、結果を「結果をもっと読み込む」という形で取得しようとしています – SAMO