2011-06-23 13 views
8

私の検索サイトではほとんどの検索エンジンでインデックスを作成したくありません。robots.txtファイルを設定して2つのディレクトリを除くすべてのファイルをブロックする方法

しかし、検索エンジンに2つのフォルダ(およびその子)のインデックスを付ける必要があります。

ここに私のrobots.txt

User-agent: * 
Allow: /archive/ 
Allow: /lsic/ 
User-agent: * 
Disallow:/

だすべて禁止するための正しい方法は何:私は非表示にしたかったグーグルのページを参照してください、これは私が設定したものですが、私はそれが動作するとは思いませんフォルダ、2を除く?

答えて

11

私はこのフォーラムhereのチュートリアルをしました。

User-agent: * 
Allow: /archive/ 
Allow: /lsic/ 
Disallow:/

をしかし、私は、それは遅すぎるかもしれない疑いがある:そしてウィキペディアにhere

は、基本的には最初に一致したrobots.txtのパターンが常に勝ちます。ページのインデックスが作成されたら、それを削除するのはかなり難しいです。唯一の方法は、別のフォルダに移動するか、フォルダをパスワードで保護することです。あなたはあなたのホストCPanelでそれを行うことができるはずです。

関連する問題