です。特定のドメインに対して単純なLinkExtractor
ルールがあります。次のようなものがあります:Rule(LinkExtractor(allow=('domain\.com/.+/\d+',)), callback='parse_page'),
ページ内でのリンクの順序はScrapy
私は何を望みますか、わかりません。ページ内のリンクがどの位置にあるかを知ることです。
たとえば、ルールに一致する5つのリンクがページ上にある場合、HTMLの上から下に順番を知る必要があります。
私は、抽出の順序について多くの質問が見つからなかったが、何も、または私はHTML