0
1ページからボットを禁止し、他のすべてのコンテンツをクロールできるようにする方法。1つのページまたはファイルからボットを禁止する方法
私はここで尋ねるので、間違っていないことが重要であるため、他の場所で決定的な答えを見つけることができません。
これは間違いありませんか?
User-Agent:*
Disallow: /dir/mypage.html
Allow:/
1ページからボットを禁止し、他のすべてのコンテンツをクロールできるようにする方法。1つのページまたはファイルからボットを禁止する方法
私はここで尋ねるので、間違っていないことが重要であるため、他の場所で決定的な答えを見つけることができません。
これは間違いありませんか?
User-Agent:*
Disallow: /dir/mypage.html
Allow:/
Disallow
行がすべて必要です。 "/dir/mypage.html"で始まるものへのアクセスはブロックされます。
Allow
行は余分です。 robots.txtのデフォルトはAllow: /
です。一般的には、Allow
は必須ではありません。許可されていないものへのアクセスを無効にすることができるように、そこにあります。たとえば、 "public"サブディレクトリ内のイメージを除いて、 "/ images"ディレクトリへのアクセスを許可しないとします。次のように書いてください:
Allow: /images/public
Disallow: /images
ここでの順序は重要です。クローラーは「最初の一致」アルゴリズムを使用することになっています。 'Disallow'を最初に書いた場合、クローラは「/ images/public」へのアクセスがブロックされたとみなします。
大変ありがとうございます。それは、比較的簡単な主題に関するテキストのどのページが失敗したかを明確に示しています。私はちょうどあなたが理解していることを確認していた。 –