2017-04-23 7 views
2

の「nofollowを」のattrを変更する方法、(CrawlSpiderから継承)Iチャンパラメータルール「に従う」が、LinkExtractorドン」change.likeの出力リンクこの:私はクモのリンク

:今私はルールを変更

[Link(url='www.example.com', text=u'', fragment='', nofollow=False)] 

rules = [ 
     Rule(CustomLinkExtractor(
      allow=[], 
      deny=[]), 
      follow=True, 
     ) 
    ] 

CustomLinkExtractorは私のカスタムLinkExtractor

プリントのリンクですの

rules = [ 
      Rule(CustomLinkExtractor(
       allow=[], 
       deny=[]), 
      ) 
     ] 

印刷リンク:

[Link(url='www.example.com', text=u'', fragment='', nofollow=False)] 

変更なし!私は、パラメータ「nofollowを」を変更する方法を知りたい、私はパラメータを考える「nofollowを」あなたを決めるかどうか、リンク

答えて

1

に従ってくださいルールのfollowパラメータをLinkExtractorのnofollowと混同しています。

ウェブサイトの中には、ウェブクローラがこのURLに従ってはならないことを示すためにrel=nofollowを使用しているものがあります。リンクノードがrel=nofollowの場合はlinkextractorと同じです。それはRuleオブジェクトとは関係ありません。

wikipedia's article on nofollowを参照してください:

nofollowのはハイパーリンクが検索でリンクのターゲットのランキングに影響を与えてはならないことを、いくつかの検索エンジンを指示するHTMLのrel属性要素に割り当てることができる値であり、エンジンのインデックス。

+0

ありがとう、それは私をたくさん助けます – Zioyi

+0

@ Zioyi問題は、それは混乱の命名の偶然です! – Granitosaurus

関連する問題