2016-04-11 4 views
-2
に許可し、禁止

http://www.robotstxt.org/orig.htmlは言う:robots.txtの

のDisallowを:/ヘルプには、両方の/help.htmlを禁止し、今

を/help/index.html、google.com/robots。リストTXT:robotparser.pyを実行する際に

Disallow: /search 
Allow: /search/about 

、それはグーグルrobots.txtで上記のケースの両方にfalseを返します。

誰かが私に説明してくださいだろう、Allow: /search/aboutAllowの使用は、それはそれ以上Disallowエントリに基づいてfalseを返すよう何ですか?

答えて

1

robotparserとそのPython 3に対応するモジュールドキュメントurllib.robotparserのモジュールドキュメントには、original specificationが使用されています。この仕様にはAllowという指令はありません。これはnon-standard extensionです。いくつかの主要なクローラーがそれをサポートしていますが、コンプライアンスの要求をサポートする必要はありません(明らかに)。

関連する問題