2011-01-03 26 views
4

は:robots.txtの優先順位の問題

Disallow /folder/ 
Allow /folder/filename.php 

をfilename.phpは、その後許されるのでしょうか?

Googleはどのような注文を優先しますか?例えば、ここでどうなりますか?:私は主に検索エンジンとして、ここでGoogleに言及してい

Allow/
Disallow/

。 Googleは最も具体的なルールの優先順位を決定しますと、あなたの最初の例

おかげ

+0

ところで、Googleはここでrobots.txtの発電機を持っていますhttp://www.google.com/support/webmasters/bin/answer.py?hl=en&answer=156449 –

+0

BTW2:使用しますサイトマップ。 http://sitemaps.org/protocol.php –

+0

BTW3ディレクティブの後にコロン( ":")を追加しない限り、これらは無視されます: –

答えて

5

は、はい、ファイル/folder/filename.phpは、許可されます。詳細については、たとえばhereまたはcheck Wikipedia's articleを参照してください。

さらに、Googleはrobots.txtをどのように使用しているかに関する詳細な文書をhereに持っています。

編集:2番目の例では、Allowは、ウィキペディアの引用文Byron Whitlockに基づいて優先順位が決定されます。

それは検索エンジンに依存
+0

+1また、http:///www.webmasterworld.com/robots_txt/3090841.htm –

+0

彼はそうです。 google http://code.google.com/web/controlcrawlindex/docs/robots_txt.htmlによれば、長い文字の長さのルールに従います(注文に関係なく)。 – dqhendricks

+0

第2のものを除き、同意する(少なくともw.r.t.Google)。 2つ目は結果が未定義(両方のパスが等しく特定)であるため、特定の場合(または検索エンジンが同意する)いずれかの方向に進むことに実際には期待できません。 robots.txtファイルにこれが表示されている場合は、削除してください。 –

2

標準実装によって は常に勝ち 最初にマッチしたrobots.txtのパターンは、Googleの実装 は で 同等以上の文字とその許可パターンで異なるがディレクティブパスが一致するパターンに一致します。 Disallowパターン。 Bingは、 AllowまたはDisallowディレクティブ( )を最も具体的に使用します。

1は内部の単一 ファイルを許可したい場合は、すべての のロボットとの互換性を保つためには、それ以外の場合は ディレクトリを許可されていない、それは 許可指令(s)は最初に配置する必要がある、許可しないで を追いました。

http://en.wikipedia.org/wiki/Robots_exclusion_standard

関連する問題