2016-12-02 10 views
1

私はrobots.txtファイルを使用して、クローラが特定のページをクロールしないようにしています。私は/folder/myfolder/myfolderのすべてをクロールないようにしたいとき、私は/folder/myfolder/robots.txtrobots.txtを入れて書くことができます。robots.txtを配置してクロールを防止する場所

User-agent: * 
Disallow:/

または私は/robots.txtrobots.txtを入れて設定する必要があります。それを知っている

User-agent: * 
Disallow: /folder/myfolder/ 

を?

+0

[robots.txtの可能な複製はいくつかのサブディレクトリを除いてすべて許可します](http://stackoverflow.com/questions/28495972/robots-txt-allow-all-except-few-sub-directories) – unor

答えて

0

方法robots.txt作品は、URL文字列のオフであるので、あなたは、このような3つのディレクトリ深かったプロジェクト、持っていた場合:

Home/ 
    /directory/ 
    - file 1 
    - file 2 
    /directory2/ 
     - file 3 

この中に置く:

User-agent: * 
Disallow:/

www.yoursite.com /(別名サイト全体)のクロールを防止します

このようなものに入れて0

User-agent: * 
Disallow: /directory1/ 

は、あなたのdirectory1フォルダ内に存在するサイト/ディレクトリのいずれかをクロールしなくなります。この例では、file 1,file 2directory 2はクロールされません。


は限り、あなたがそれを置くことができる場所として、私はいつも、私のホームディレクトリに、あなたのindex.htmlファイルを入れて同じ場所にそれを置きます。

+0

Shouldn ' 'http:// example.com/www.yoursite.com/directory1 /'のようなURLのように、実際にURLパスの一部でない限り、 'www.yoursite.com'を含んでいません。 – unor

+1

@ unor固定、私たちはフィールドに置かれている場合は削除する必要があるソフトウェアを使用します。通知ありがとう! –

関連する問題