2011-06-28 4 views
2

私はrobots.txtファイルを削除しなければならない状況があります。なぜなら、ロボットのクローラがリンクを取得したくないからです。robots.txtを.htaccessに置き換える方法

また、私はそれらをユーザーがアクセスできるようにしたいが、私はそれらを検索エンジンにキャッシュさせたくない。

また、私はさまざまな理由でユーザー認証を追加できません。

mod-rewriteを使用して検索エンジンのクローラをクロールすることを無効にし、他のすべてのユーザーがそれを実行できるようにすることを考えています。

私はincommingユーザエージェントは、検索エンジンであるとはい、その後401

にそれらを再指示した場合にのみ、問題は私にはわからないかどうかをチェックするための条件を記述されて実装しようとしていますロジックそれを実装する方法。 :(

誰かが

よろしく、

答えて

2

私は間違ってあなたを理解することができる。事前に

おかげ。それで私を助け、私はロボットで

User-agent: * 
Disallow:/

を考えることができます.txtはあなたの望むものだけを実行します。通常のユーザーにはウェブサイトを開いたままクローラを許可しません。

または、Webサーバーからrobots.txtを(何らかの理由で)削除する必要がありますか?

+0

絶対にすべてのクローラがあなたのサイトの閲覧を止めることはありません(robots.txtを尊重するもの - すべての大きな検索エンジンがそれを行います)。しかし、これは間違いなく始まる方法です。 – LazyOne

+1

「適切な」User-Agentを含め、必要な情報を送信できるので、robots.txtを尊重しないカスタムクローラを停止する方法はありません。 – Inoryy

+0

私はあなたに絶対に同意します。このコメントはむしろOPよりむしろOPに向けられました - 私はちょうど質問よりもここにコメントを残しておく方が適切だと思った。 – LazyOne

関連する問題