私はrobots.txtファイルを削除しなければならない状況があります。なぜなら、ロボットのクローラがリンクを取得したくないからです。robots.txtを.htaccessに置き換える方法
また、私はそれらをユーザーがアクセスできるようにしたいが、私はそれらを検索エンジンにキャッシュさせたくない。
また、私はさまざまな理由でユーザー認証を追加できません。
mod-rewriteを使用して検索エンジンのクローラをクロールすることを無効にし、他のすべてのユーザーがそれを実行できるようにすることを考えています。
私はincommingユーザエージェントは、検索エンジンであるとはい、その後401
にそれらを再指示した場合にのみ、問題は私にはわからないかどうかをチェックするための条件を記述されて実装しようとしていますロジックそれを実装する方法。 :(
誰かが
よろしく、
絶対にすべてのクローラがあなたのサイトの閲覧を止めることはありません(robots.txtを尊重するもの - すべての大きな検索エンジンがそれを行います)。しかし、これは間違いなく始まる方法です。 – LazyOne
「適切な」User-Agentを含め、必要な情報を送信できるので、robots.txtを尊重しないカスタムクローラを停止する方法はありません。 – Inoryy
私はあなたに絶対に同意します。このコメントはむしろOPよりむしろOPに向けられました - 私はちょうど質問よりもここにコメントを残しておく方が適切だと思った。 – LazyOne