2009-03-25 5 views
3

をボットを禁止:のrobots.txt:私はこのような構造とのリンクを持っている与えられた "URLの深さ" にアクセスする

google &は、URL内にONEタグを持つすべてのリンクをスパイダーしたいが、2つ以上のタグを持つURLではない。

現在、私は問題を解決するためにhtmlメタタグ"robots" -> "noindex, nofollow"を使用しています。

robots.txtソリューション(少なくともいくつかの検索ボットで動作します)がありますか、「noindex、nofollow」を続行して追加のトラフィックを生き延びる必要がありますか?

答えて

1

私はあなたがrobots.txtを使って行うことはできないと思います。 The standardはかなり狭いです(ワイルドカードはなく、トップレベルになければなりません)。

あなたのサーバーのユーザーエージェントに基づいてそれらを許可しないのはどうですか?

+0

アクセスを許可しないと、何らかのHTTPエラーが発生します。 Googleが「サーバーエラー」が多いページにどう反応するかはわかりません。試してみるのはあまり熱心ではありません:) – BlaM

+0

あなたは安く静的な「ここには何も見ない」ページを提供することができます。 – MarkusQ

+0

それは本当です。少なくともフルページを提供するよりも良いでしょう。 – BlaM

関連する問題